목록Data Analysis/시각화 (18)
Allen's 데이터 맛집

이번 포스팅에선 데이터 분석에서 중요한 시각화 기법 중 하나인 생키 다이어그램(Sankey Diagram)에 대해 알아보려고 합니다. 생키 다이어그램은 복잡한 흐름과 분포를 시각적으로 표현하는 데 매우 유용한 도구입니다.이미지 출처:https://public.tableau.com/app/profile/ken.flerlage/viz/Sankey_25/Sankey 1. 생키 다이어그램이란? 생키 다이어그램은 에너지, 자원, 비용, 데이터 흐름 등에서 각 요소 간의 흐름과 분포를 시각화하는 데 사용되는 그래프입니다. 이 다이어그램은 흐름의 시작과 끝을 보여주는 노드(Node)와, 노드 간의 연결을 나타내는 링크(Link)로 구성됩니다.노드(Node)는 데이터의 출발지와 도착지를 나타내며, 링크(Link)는 ..

쥬피터 노트북을 사용하여 그래프를 그릴 때 생각보다 흐릿하게, 뚜렷하지 않게 출력이 되지 않는 경우, 간단한 코드를 통해 이를 해결이 가능합니다. [적용 전] sns.countplot(data = df1, y = '메세지') 위와 같이 그래프와 그래프 내의 글자가 선명하지 않을 경우, 아래의 코드를 통해 선명하게 해결이 가능합니다. [적용 후]from IPython.display import set_matplotlib_formats # 그래프 서체를 선명하게 출력set_matplotlib_formats('retina')

데이터 분석에서 다변량 데이터의 패턴과 관계를 파악하는 것은 깊은 인사이트를 얻기 위해 중요합니다. 산점도는 변수 간의 관계를 시각적으로 탐색하는 데 매우 유용한 도구로, 특히 색상과 농도를 추가함으로써 다변량 데이터의 복잡한 관계를 보다 효과적으로 나타낼 수 있습니다. 이미지출처 : https://dataonair.or.kr/db-tech-reference/d-lounge/expert-column/?mod=document&uid=52072산점도에서 다변량 데이터 시각화의 중요성산점도는 두 변수 간의 관계를 포인트로 표시하여 그 관계의 성격을 쉽게 이해할 수 있게 해줍니다. 다변량 데이터에 색상과 농도를 추가하면, 추가 변수의 영향을 한 눈에 파악할 수 있어 데이터 분석의 깊이와 정확성을 높일 ..

데이터 시각화에서 산점도(Scatter Plot)는 두 변수 간의 관계를 표현하는 기본적이면서도 강력한 도구입니다. 특히, 시간 변수를 포함한 산점도는 시간에 따른 데이터의 변화와 패턴을 분석하는 데 유용합니다 시간을 활용한 산점도의 중요성 시간을 변수로 포함하는 산점도는 데이터의 시간적 변화를 시각화하여, 추세, 주기성, 또는 이상 현상 등을 파악할 수 있게 해줍니다. 이는 금융 데이터 분석, 사용자 행동 분석, 과학 연구 등 다양한 분야에서 의사결정을 지원하고, 전략을 수립하는 데 필수적인 도구입니다. 산점도에서 시간 시각화의 구현 import pandas as pd import matplotlib.pyplot as plt import matplotlib.dates as mdates from date..