Allen's 데이터 맛집

산포도 - 편차, 분산, 표준편차 본문

Data Analysis/통계&분석

산포도 - 편차, 분산, 표준편차

Allen93 2023. 12. 16. 01:30
데이터 집합이 얼마나 퍼져 있는지를 알아보는 데 사용하는 값들

 

 

 

산포도 :

- 자료의 변량들이 흩어져 있는 정도를 하나의 수로 나타낸 값

- 산포도가 크면 변량들이 평균으로부터 멀리 흩어져 있음, 변동성이 커짐 

- 산포도가 작으면 변량들이 평균 주위에 밀집, 변동성이 작아짐 

- 범위, 사분위 범위, 분산, 표준 편차, 절대 편차, 변동 계수

 

 

편차 :

- 어떤 자료의 변량에서 평균을 뺀 값을 편차라고 한다 (편차 = 변량 – 평균) 

- 편차의 총합은 항상 0, 편차의 절댓값이 클수록 그 변량은 평균에서 멀리 떨어져 있고, 편차의 절댓값이 작을수록 평균에 가까이 있다

 

 

분산(s2) :

- 편차의 제곱의 합을 n-1로 나눈 것 

- 데이터 집합이 얼마나 퍼져 있는지 알아볼 수 있는 수치 

- 평균이 같아도 분산은 다를 수 있음

분산

 

 

표준편차(s) :

- 자료의 산포도를 나타내는 수치, 분산의 양의 제곱근 

- 평균으로부터 각 데이터의 관찰 값까지의 평균거리

분산

 

728x90