목록정확도 (3)
Allen's 데이터 맛집

데이터 과학과 기계 학습에서 모델의 성능을 평가하는 데 있어 혼동행렬(Confusion Matrix)은 필수적인 도구입니다.이미지출처:https://namu.wiki/w/%ED%98%BC%EB%8F%99%ED%96%89%EB%A0%AC 혼동행렬이란?혼동행렬은 분류 문제에서 모델의 성능을 시각적으로 표현하는 표입니다. 이 행렬은 실제 클래스와 예측 클래스를 축으로 하여, 각 클래스에 속하는 예측 결과를 요약하여 보여줍니다. 주로 이진 분류 문제에서 사용되지만, 다중 클래스 분류 문제에서도 확장 사용될 수 있습니다.혼동행렬의 구성 요소- True Positive (TP): 실제 양성 클래스를 정확히 양성으로 예측한 경우의 수입니다. - True Negative (TN): 실제 음성 클래스를..

분류 모델의 성능을 평가하는 데 있어 정확도만으로는 모델의 진정한 성능을 파악하기 어려운 경우가 종종 있습니다. 특히 불균형한 데이터셋에서는 더욱 그렇습니다. 이러한 상황에서 카파 상관계수(Kappa Coefficient)는 모델 평가의 유용한 지표로 활용됩니다. 이 글에서는 카파 상관계수의 개념, 계산 방법, 그리고 중요성에 대해 알아보겠습니다. 카파 상관계수(Kappa Coefficient)란? 카파 상관계수는 두 관측자의 평가 일치도를 측정하는 통계적 방법으로 시작되었으나, 분류 모델에서 예측 정확도가 무작위 추측보다 얼마나 더 나은지를 평가하는 데에도 사용됩니다. -1부터 +1까지의 범위를 가지며, 값이 클수록 모델의 성능이 더 좋음을 의미합니다. 카파 상관계수의 계산 카파 상관계수는 다음 공식으..

분류 모형의 성능을 평가하는 것은 머신러닝에서 중요한 단계입니다. 오분류표(Confusion Matrix)를 기반으로 한 평가 지표들은 모델이 얼마나 잘 작동하는지를 이해하는 데 필수적입니다. 오분류표(Confusion Matrix)란? 오분류표는 실제 클래스와 모델이 예측한 클래스의 관계를 표 형태로 나타낸 것입니다. 주로 이진 분류 문제에서 사용되며, 표는 다음과 같은 네 가지 요소로 구성됩니다. - True Positive (TP): 실제 양성을 양성으로 올바르게 예측한 경우 - False Positive (FP): 실제 음성을 잘못하여 양성으로 예측한 경우 - True Negative (TN): 실제 음성을 음성으로 올바르게 예측한 경우 - False Negative (FN): 실제 양성을 잘못하..