목록Data Analysis (82)
Allen's 데이터 맛집
이번 포스팅에서 변수간의 관계를 쉽게 파악하게 도와주는 산점도, 산점도 행렬 그리고 버블 차트에 대해서 알아보겠습니다. 이 그래프들은 X, Y축 변수의 관계를 시각화 한 것입니다. 산점도(Scatter Plot): 산점도는 두 변수 간의 관계를 보여주는데 사용됩니다. 각 데이터 포인트는 그래프 상의 점으로 표현되며, 두 변수 간의 관계를 시각적으로 이해할 수 있습니다. 이를 통해 변수 간의 상관 관계, 패턴, 이상치 등을 파악할 수 있습니다. 산점도 행렬(Scatter Plot Matrix): 산점도 행렬은 여러 변수 간의 관계를 보여주는데 사용됩니다. 데이터 집합 내의 모든 변수 쌍에 대해 산점도를 생성하여 한 번에 여러 변수 간의 상관 관계를 파악할 수 있습니다. 이를 통해 변수 간의 다변량 관계를 ..
이번 포스팅에서는 시계열 데이터를 시각화 할때 막대그래프와 함께 자주 쓰이는 선 그래프에 대해서 설명드리겠습니다. 선 그래프(Line Graph): 선 그래프는 데이터 포인트를 선으로 연결하여 변화 추이를 보여주는데 사용됩니다. 시간이나 연속적인 변수에 대한 변화를 시각적으로 보여줄 때 유용합니다. 데이터 포인트를 연결하여 추세를 시각화하고 패턴을 파악하는데 사용됩니다. 영역 차트(Area Chart): 영역 차트는 선 그래프와 유사하지만 그래프 아래 영역을 색칠하여 데이터가 차지하는 영역을 강조합니다. 데이터의 전체적인 변화 패턴을 시각적으로 이해할 수 있으며, 선 그래프보다 데이터의 추세를 더 명확하게 보여줍니다. 계단식 그래프(Step Chart): 계단식 그래프는 데이터 포인트 간의 연결이 직선이..
이번 포스팅에선 가장 많이 쓰이는 그래프 중 범주형과 시각화를 나타내는 막대 그래프(bar chart)의 종류에 대해서 설명해 드리겠습니다. 막대 그래프(Bar Graph): 막대 그래프는 범주형 데이터의 값들을 막대로 나타내어 각 항목 간의 크기를 시각적으로 비교할 수 있게 해줍니다. 보통 가로 또는 세로 막대로 표현됩니다. 각 막대의 길이는 해당하는 값의 크기를 나타냅니다. 누적 막대 그래프(Stacked Bar Graph): 누적 막대 그래프는 각 항목이 서로 다른 부분으로 구분되어 있고, 각 부분의 합이 전체 막대의 길이가 되도록 표현됩니다. 각 항목의 부분을 쌓아 올린 모양으로 표현되어, 전체적인 비교와 각 항목의 구성 비율을 시각적으로 이해할 수 있게 해줍니다. 그룹 막대 그래프(Grouped..
상자 그림(Boxplot)은 데이터의 중앙값, 사분위수, 이상치 등을 시각적으로 보여주는 통계적인 도구입니다. 이는 데이터의 분포와 이상치를 직관적으로 이해할 수 있게 해 줍니다. 상자 그림은 다음과 같은 요소들을 포함합니다: - 상자(Box): 데이터의 사분위수를 보여줍니다. 상자의 아래쪽 가장자리는 1사분위수(Q1)를, 위쪽 가장자리는 3사분위수(Q3)를 나타냅니다. 상자 내의 가로선은 중앙값을 나타냅니다. - 수염(Whiskers): 일반적으로 1.5 * IQR(사분위 범위)를 넘어가는 범위의 데이터를 이상치로 표시합니다. 이상치 이상의 데이터는 점으로 나타낼 수 있습니다. - 이상치(Outliers): 전체 데이터에서 벗어난 값들로, 흔히 점으로 나타내어 표시합니다. 이미지출처:https://ww..