목록박스-플롯 (2)
Allen's 데이터 맛집

상자 그림(Boxplot)은 데이터의 중앙값, 사분위수, 이상치 등을 시각적으로 보여주는 통계적인 도구입니다. 이는 데이터의 분포와 이상치를 직관적으로 이해할 수 있게 해 줍니다. 상자 그림은 다음과 같은 요소들을 포함합니다: - 상자(Box): 데이터의 사분위수를 보여줍니다. 상자의 아래쪽 가장자리는 1사분위수(Q1)를, 위쪽 가장자리는 3사분위수(Q3)를 나타냅니다. 상자 내의 가로선은 중앙값을 나타냅니다. - 수염(Whiskers): 일반적으로 1.5 * IQR(사분위 범위)를 넘어가는 범위의 데이터를 이상치로 표시합니다. 이상치 이상의 데이터는 점으로 나타낼 수 있습니다. - 이상치(Outliers): 전체 데이터에서 벗어난 값들로, 흔히 점으로 나타내어 표시합니다. 이미지출처:https://ww..

데이터 분석에서 시각화는 데이터의 패턴과 관계를 이해하는 데 중요한 역할을 합니다. 다양한 유형의 그래픽은 데이터를 이해하고 시각화하는 데 도움이 됩니다. 여기에 일반적으로 사용되는 몇 가지 시각화 유형을 말씀드리겠습니다. 선 그래프(Line Graph): 데이터의 변화를 시간에 따라 보여주는 데 사용됩니다. 주로 시계열 데이터를 분석할 때 유용합니다. 산점도(Scatter Plot): 두 변수 간의 관계를 보여주는데 사용됩니다. 변수 간의 상관관계를 확인하고 패턴을 파악하는 데 유용합니다. 히스토그램(Histogram): 데이터의 분포를 보여주는데 사용됩니다. 데이터의 빈도를 막대 형태로 나타내어 데이터의 분포를 시각적으로 이해할 수 있게 도와줍니다. 바 차트(Bar Chart): 범주형 데이터의 각 ..