목록Machine Learning/머신러닝 (45)
Allen's 데이터 맛집
"데이터의 미로, Decision Tree 분류 모델" 이번에는 데이터 분류에 활용되는 'Decision Tree(의사 결정 트리)' 분류 모델을 알아보겠습니다. 이 모델은 데이터의 규칙을 분석하여 예측을 수행하는 직관적이고 강력한 도구입니다. Decision Tree 분류 모델은 데이터를 분기점과 결정 영역으로 나누어 가며 예측을 수행합니다. 각 분기점은 특정 특성의 값에 따라 데이터를 서로 다른 클래스로 할당하게 됩니다. 이미지출처:https://dlsdn73.tistory.com/655 간단한 파이썬 코드 예제: from sklearn.datasets import load_iris from sklearn.tree import DecisionTreeClassifier from sklearn.model..
"주변의 친구를 물어보다, K-Nearest Neighbors 분류 모델" 이번에는 데이터 분류에 사용되는 머신러닝 알고리즘 중 하나인 'K-Nearest Neighbors(KNN)' 분류 모델에 대해 알아보려 합니다. 이 모델은 주변 데이터의 클래스를 참고하여 예측하는 간단하면서도 강력한 방법입니다. 이미지 출처 : https://bkshin.tistory.com/entry/%EB%A8%B8%EC%8B%A0%EB%9F%AC%EB%8B%9D-6-K-%EC%B5%9C%EA%B7%BC%EC%A0%91%EC%9D%B4%EC%9B%83KNN KNN 분류 모델은 주어진 데이터 포인트 주변의 k개의 이웃 데이터를 참고하여 예측을 수행합니다. 이웃 데이터 포인트들의 클래스 중 가장 많은 클래스를 현재 데이터 포인트의..
"데이터 예측의 정확도 측정, 회귀 모델 성능 평가" 데이터 분석과 머신러닝을 통해 예측 모델을 만들 때 중요한 과정 중 하나인 '회귀 모델 성능 평가'에 대해 알아보겠습니다. 모델의 예측 결과를 정량적으로 평가하고 비교하는 것은 예측의 정확도를 평가하는 데 매우 중요합니다. 회귀 모델 성능 평가: 예측과 실제의 접점 회귀 모델의 성능을 평가하는 주요 지표들을 알아보겠습니다. 이러한 지표들은 모델의 예측 결과와 실제 값 사이의 차이를 정량화하여 모델의 정확도를 측정합니다. R-squared (R2) Score: R2 스코어는 예측 결과와 실제 값 사이의 분산 비율을 나타내며, 0에서 1 사이의 값을 가집니다. 높은 R2 스코어는 모델이 데이터를 얼마나 잘 설명하는지를 나타냅니다. 1에 가까울수록 좋은 모..
"데이터 예측의 힘, 앙상블(Ensemble) 모델" 지난번에 이어서 데이터 분석과 머신러닝의 대표적인 모델 중 하나인 '앙상블(Ensemble)' 모델을 살펴보려 합니다. 앙상블은 다양한 예측 모델을 결합하여 보다 강력하고 정확한 예측을 이끌어내는 방법입니다. 앙상블은 여러 개의 예측 모델을 함께 사용하여 결과를 조합하는 기법을 의미합니다. 이는 한 사람의 전문적인 의견보다 다양한 사람들의 의견을 듣는 것과 비슷합니다. 다양한 모델이 각자의 강점을 가지고 있기 때문에, 이들을 조합하면 전체적으로 성능을 향상시킬 수 있습니다. 이미지 출처 : https://velog.io/@changhtun1/ensemble 파이썬 코드 예제: from sklearn.datasets import load_iris fro..