Allen's 데이터 맛집

상관계수와 공분산 본문

Data Analysis/통계&분석

상관계수와 공분산

Allen93 2023. 10. 25. 23:39

피어슨 상관계수(Pearson Correlation Coefficient):


- 피어슨 상관계수는 두 변수 간의 선형 관계를 측정하는 데 사용됩니다.
- 값은 -1에서 1 사이에 있으며, 1에 가까울수록 강한 양의 선형 관계, -1에 가까울수록 강한 음의 선형 관계를 나타냅니다.
- 0에 가까울수록 두 변수 간의 선형 관계가 약하거나 없음을 나타냅니다.

피어슨 상관계수

 

스피어만 상관계수(Spearman's Rank Correlation Coefficient):


- 스피어만 상관계수는 두 변수 간의 순위 관계를 측정하는 데 사용됩니다.
- 두 변수 간의 명목적 관계나 비선형 관계를 측정하는 데 유용합니다.
- 피어슨 상관계수와 달리 데이터의 정규성 가정이 필요하지 않습니다.

스피어만 상관계수

 


공분산(Covariance):


- 공분산은 두 변수 간의 관계를 측정하는 데 사용됩니다.
- 두 변수가 함께 변하는 정도를 측정하며, 값의 부호는 두 변수 간의 관계가 양의 관계인지 음의 관계인지를 나타냅니다.
- 그러나 공분산의 값 자체만으로는 두 변수의 척도가 다르기 때문에 비교가 어렵습니다.

공분산

 


이러한 상관계수와 공분산은 데이터 간의 관계를 측정하여 변수 간의 상호작용을 이해하는 데 사용됩니다. 적절한 상관계수나 공분산을 선택하여 데이터의 특성에 가장 적합한 분석을 수행하는 것이 중요합니다.

728x90