목록전체 글 (340)
Allen's 데이터 맛집
"데이터 예측의 정확도 측정, 회귀 모델 성능 평가" 데이터 분석과 머신러닝을 통해 예측 모델을 만들 때 중요한 과정 중 하나인 '회귀 모델 성능 평가'에 대해 알아보겠습니다. 모델의 예측 결과를 정량적으로 평가하고 비교하는 것은 예측의 정확도를 평가하는 데 매우 중요합니다. 회귀 모델 성능 평가: 예측과 실제의 접점 회귀 모델의 성능을 평가하는 주요 지표들을 알아보겠습니다. 이러한 지표들은 모델의 예측 결과와 실제 값 사이의 차이를 정량화하여 모델의 정확도를 측정합니다. R-squared (R2) Score: R2 스코어는 예측 결과와 실제 값 사이의 분산 비율을 나타내며, 0에서 1 사이의 값을 가집니다. 높은 R2 스코어는 모델이 데이터를 얼마나 잘 설명하는지를 나타냅니다. 1에 가까울수록 좋은 모..
"데이터 예측의 힘, 앙상블(Ensemble) 모델" 지난번에 이어서 데이터 분석과 머신러닝의 대표적인 모델 중 하나인 '앙상블(Ensemble)' 모델을 살펴보려 합니다. 앙상블은 다양한 예측 모델을 결합하여 보다 강력하고 정확한 예측을 이끌어내는 방법입니다. 앙상블은 여러 개의 예측 모델을 함께 사용하여 결과를 조합하는 기법을 의미합니다. 이는 한 사람의 전문적인 의견보다 다양한 사람들의 의견을 듣는 것과 비슷합니다. 다양한 모델이 각자의 강점을 가지고 있기 때문에, 이들을 조합하면 전체적으로 성능을 향상시킬 수 있습니다. 이미지 출처 : https://velog.io/@changhtun1/ensemble 파이썬 코드 예제: from sklearn.datasets import load_iris fro..
"데이터의 숨은 규칙, Decision Tree 모델" 데이터 분석과 머신러닝을 통해 현실을 해석하고 예측하는 데 도움이 되는 다양한 알고리즘 중 하나인 'Decision Tree(의사 결정 트리)' 모델을 소개하려 합니다. 이 모델은 마치 의사 결정을 내리는 과정과 유사하게 데이터의 규칙을 분석하여 판단하는 간단하면서도 강력한 도구입니다. 이미지 출처 : https://algodaily.com/lessons/decision-trees-basics Decision Tree는 데이터의 특성과 결과 사이에 내재된 패턴을 찾아내기 위해 사용됩니다. 이 모델은 나무 구조와 비슷한 형태로, 데이터를 여러 개의 '분기점'과 '리프(Leaf)'로 나누어 각각의 분기점에서 최적의 결정을 내리게 됩니다. 이는 마치 미로..
이번 글에서는 데이터 분석의 기초인 선형 회귀와 그의 변형들에 대해 알아보려고 합니다. 데이터 분석은 현대 사회에서 매우 중요한 역할을 하며, 그중에서도 선형 회귀는 가장 기본적이면서도 강력한 도구 중 하나입니다. 단순 선형 회귀 (Simple Linear Regression) 가장 기본적인 선형 회귀로, 한 개의 독립 변수와 한 개의 종속 변수 간의 관계를 분석합니다. 즉 하나의 X 값을 가지고 Y를 예측하는 것입니다. 예를 들어, 공부 시간과 시험 점수 사이의 관계를 알고 싶을 때 사용될 수 있습니다. 간단한 파이썬 코드 예시는 다음과 같습니다: import numpy as np from sklearn.linear_model import LinearRegression # 데이터 생성 X = np.ar..