목록Data Analysis/시각화 (17)
Allen's 데이터 맛집
이번 포스팅에서는 시계열 데이터를 시각화 할때 막대그래프와 함께 자주 쓰이는 선 그래프에 대해서 설명드리겠습니다. 선 그래프(Line Graph): 선 그래프는 데이터 포인트를 선으로 연결하여 변화 추이를 보여주는데 사용됩니다. 시간이나 연속적인 변수에 대한 변화를 시각적으로 보여줄 때 유용합니다. 데이터 포인트를 연결하여 추세를 시각화하고 패턴을 파악하는데 사용됩니다. 영역 차트(Area Chart): 영역 차트는 선 그래프와 유사하지만 그래프 아래 영역을 색칠하여 데이터가 차지하는 영역을 강조합니다. 데이터의 전체적인 변화 패턴을 시각적으로 이해할 수 있으며, 선 그래프보다 데이터의 추세를 더 명확하게 보여줍니다. 계단식 그래프(Step Chart): 계단식 그래프는 데이터 포인트 간의 연결이 직선이..
이번 포스팅에선 가장 많이 쓰이는 그래프 중 범주형과 시각화를 나타내는 막대 그래프(bar chart)의 종류에 대해서 설명해 드리겠습니다. 막대 그래프(Bar Graph): 막대 그래프는 범주형 데이터의 값들을 막대로 나타내어 각 항목 간의 크기를 시각적으로 비교할 수 있게 해줍니다. 보통 가로 또는 세로 막대로 표현됩니다. 각 막대의 길이는 해당하는 값의 크기를 나타냅니다. 누적 막대 그래프(Stacked Bar Graph): 누적 막대 그래프는 각 항목이 서로 다른 부분으로 구분되어 있고, 각 부분의 합이 전체 막대의 길이가 되도록 표현됩니다. 각 항목의 부분을 쌓아 올린 모양으로 표현되어, 전체적인 비교와 각 항목의 구성 비율을 시각적으로 이해할 수 있게 해줍니다. 그룹 막대 그래프(Grouped..
상자 그림(Boxplot)은 데이터의 중앙값, 사분위수, 이상치 등을 시각적으로 보여주는 통계적인 도구입니다. 이는 데이터의 분포와 이상치를 직관적으로 이해할 수 있게 해 줍니다. 상자 그림은 다음과 같은 요소들을 포함합니다: - 상자(Box): 데이터의 사분위수를 보여줍니다. 상자의 아래쪽 가장자리는 1사분위수(Q1)를, 위쪽 가장자리는 3사분위수(Q3)를 나타냅니다. 상자 내의 가로선은 중앙값을 나타냅니다. - 수염(Whiskers): 일반적으로 1.5 * IQR(사분위 범위)를 넘어가는 범위의 데이터를 이상치로 표시합니다. 이상치 이상의 데이터는 점으로 나타낼 수 있습니다. - 이상치(Outliers): 전체 데이터에서 벗어난 값들로, 흔히 점으로 나타내어 표시합니다. 이미지출처:https://ww..
히스토그램(Histogram) 히스토그램은 도수 분포표를 그래픽으로 표현한 것입니다. 가로축에는 각 계급을, 세로축에는 해당 계급에 속하는 데이터의 빈도를 나타내며, 이를 직사각형 모양으로 나타냅니다. 막대의 높이는 빈도를 나타내며, 막대의 폭은 중요하지 않습니다. 만약 히스토그램이 왼쪽으로 치우쳐 있다면, 데이터는 전체 범위에서 수치가 낮은 쪽에 몰려 있다는 것을 의미합니다. 반면 오른쪽으로 치우쳐 있다면 데이터는 더 높은 수치 부분에 몰려 있다는 것을 의미합니다. 만약 막대가 비슷한 높이로 그려진다면, 데이터는 균일한 분포를 가진 것입니다. 가로축과 세로축은 모두 연속적이며, 이를 통해 많은 양의 데이터를 효과적으로 시각화할 수 있습니다. 히스토그램은 데이터의 분포를 파악하고, 이해하는 데 유용한 그..