Allen's 데이터 맛집

상자그림(Box plot) 본문

Data Analysis/시각화

상자그림(Box plot)

Allen93 2023. 10. 28. 23:53

상자 그림(Boxplot)은 데이터의 중앙값, 사분위수, 이상치 등을 시각적으로 보여주는 통계적인 도구입니다. 이는 데이터의 분포와 이상치를 직관적으로 이해할 수 있게 해 줍니다.




상자 그림은 다음과 같은 요소들을 포함합니다:

- 상자(Box): 데이터의 사분위수를 보여줍니다. 상자의 아래쪽 가장자리는 1사분위수(Q1)를, 위쪽 가장자리는 3사분위수(Q3)를 나타냅니다. 상자 내의 가로선은 중앙값을 나타냅니다.


- 수염(Whiskers): 일반적으로 1.5 * IQR(사분위 범위)를 넘어가는 범위의 데이터를 이상치로 표시합니다. 이상치 이상의 데이터는 점으로 나타낼 수 있습니다.


- 이상치(Outliers): 전체 데이터에서 벗어난 값들로, 흔히 점으로 나타내어 표시합니다.

박스-플롯

이미지출처:https://www.kdnuggets.com/2019/11/understanding-boxplots.html

 

상자 그림은 데이터의 분포와 중앙값, 이상치 등을 시각적으로 파악할 수 있도록 도와줍니다. 이를 통해 데이터 세트의 중심 경향과 분산을 이해하는 데 도움이 됩니다. 이를 통해 데이터의 특성을 파악하고 다양한 그룹 간의 비교를 쉽게 할 수 있습니다.