목록전체 글 (367)
Allen's 데이터 맛집

"데이터 예측의 힘, 앙상블(Ensemble) 모델" 지난번에 이어서 데이터 분석과 머신러닝의 대표적인 모델 중 하나인 '앙상블(Ensemble)' 모델을 살펴보려 합니다. 앙상블은 다양한 예측 모델을 결합하여 보다 강력하고 정확한 예측을 이끌어내는 방법입니다. 앙상블은 여러 개의 예측 모델을 함께 사용하여 결과를 조합하는 기법을 의미합니다. 이는 한 사람의 전문적인 의견보다 다양한 사람들의 의견을 듣는 것과 비슷합니다. 다양한 모델이 각자의 강점을 가지고 있기 때문에, 이들을 조합하면 전체적으로 성능을 향상시킬 수 있습니다. 이미지 출처 : https://velog.io/@changhtun1/ensemble 파이썬 코드 예제: from sklearn.datasets import load_iris fro..

"데이터의 숨은 규칙, Decision Tree 모델" 데이터 분석과 머신러닝을 통해 현실을 해석하고 예측하는 데 도움이 되는 다양한 알고리즘 중 하나인 'Decision Tree(의사 결정 트리)' 모델을 소개하려 합니다. 이 모델은 마치 의사 결정을 내리는 과정과 유사하게 데이터의 규칙을 분석하여 판단하는 간단하면서도 강력한 도구입니다. 이미지 출처 : https://algodaily.com/lessons/decision-trees-basics Decision Tree는 데이터의 특성과 결과 사이에 내재된 패턴을 찾아내기 위해 사용됩니다. 이 모델은 나무 구조와 비슷한 형태로, 데이터를 여러 개의 '분기점'과 '리프(Leaf)'로 나누어 각각의 분기점에서 최적의 결정을 내리게 됩니다. 이는 마치 미로..

이번 글에서는 데이터 분석의 기초인 선형 회귀와 그의 변형들에 대해 알아보려고 합니다. 데이터 분석은 현대 사회에서 매우 중요한 역할을 하며, 그중에서도 선형 회귀는 가장 기본적이면서도 강력한 도구 중 하나입니다. 단순 선형 회귀 (Simple Linear Regression) 가장 기본적인 선형 회귀로, 한 개의 독립 변수와 한 개의 종속 변수 간의 관계를 분석합니다. 즉 하나의 X 값을 가지고 Y를 예측하는 것입니다. 예를 들어, 공부 시간과 시험 점수 사이의 관계를 알고 싶을 때 사용될 수 있습니다. 간단한 파이썬 코드 예시는 다음과 같습니다: import numpy as np from sklearn.linear_model import LinearRegression # 데이터 생성 X = np.ar..

로지스틱 회귀: 데이터에서 패턴을 찾는 마법 같은 모델 로지스틱 회귀는 데이터에서 어떤 패턴을 찾아내고, 그 패턴을 활용하여 미래의 상황을 예측하는 분류 모델입니다. 이 모델은 물론 회귀라는 이름이 붙어 있지만, 실제로는 주로 분류 작업에 사용됩니다. 로지스틱 회귀의 특징 이름 헷갈리지 말기! '로지스틱 회귀'라는 이름은 회귀라는 단어가 들어가지만, 실제로는 데이터의 분류 작업에 사용됩니다. 미래에 무엇이 발생활 지를 예측하는 것이 아니라, 어떤 분류에 속하는지를 예측하는 모델입니다. 0과 1 사이의 확률로 생각하기! 로지스틱 회귀는 예측 결과를 0과 1 사이의 값으로 변환합니다. 이 값을 확률로 해석하여, 어떤 클래스에 속할 가능성이 더 높은 지를 알 수 있습니다. S자 형태의 곡선을 그리기! 로지스틱..