목록데이터-시각화 (12)
Allen's 데이터 맛집

데이터 시각화는 복잡한 정보를 이해하기 쉬운 형태로 전달하는 데 필수적인 도구입니다. 지리적 데이터 시각화에서 코로플레스 맵은 지역별 차이와 패턴을 한눈에 파악할 수 있게 해주는 강력한 방법 중 하나입니다. 코로플레스 맵(Cloropleth Map)이란? 코로플레스 맵은 지리적 영역을 다양한 색상으로 칠하여, 특정 통계량이나 값을 시각적으로 표현하는 지도입니다. 색상의 깊이나 밝기는 해당 지역의 데이터 값의 크기를 나타내며, 이를 통해 지역 간 비교와 분석이 용이해집니다. 코로플레스 맵의 작성 방법 1. 데이터 준비: 시각화하고자 하는 지리적 데이터와 해당 지역의 통계량을 준비합니다. 2. 지리적 영역 결정: 지도 상에서 시각화할 지역의 경계를 정의합니다. 3. 색상 척도 선택: 데이터 값에 따라 색상을..

데이터 시각화는 복잡한 정보를 이해하기 쉽고, 직관적인 형태로 전달하는 강력한 수단입니다. 특히, 계단식 그래프와 영역 차트는 시계열 데이터나 순차적 데이터를 표현하는 데 있어 유용한 기법들 중 하나입니다. 계단식 그래프(Step Chart) 계단식 그래프는 데이터 포인트 사이를 직선이 아닌 계단 모양으로 연결하는 차트입니다. 이는 시간에 따른 데이터의 변화를 단계별로 명확하게 보여주고자 할 때 주로 사용됩니다. 특징 및 장점 - 명확한 변화 시점 표시: 계단식 그래프는 데이터가 변경되는 정확한 시점을 강조하여 보여줍니다. - 이산적 데이터 표현에 적합: 특히 값이 갑자기 변하는 이산적 데이터를 시각화하기에 적합합니다. - 비교 용이: 여러 계단식 그래프를 병렬로 표시함으로써, 다양한 시계열 데이터의 변..

이상값(Outliers)은 일반적인 데이터 패턴에서 벗어난 값으로, 데이터 분석 과정에서 중요한 역할을 합니다. 이상값은 일반적으로 다음과 같은 특징을 가집니다. 이미지출처:https://brunch.co.kr/@mbook/12 개념과 특징: 이상값은 데이터 분포에서 일반적인 규칙을 벗어난 값으로, 예를 들어 극단적으로 크거나 작은 값일 수 있습니다. 이상값은 데이터 분석 결과를 왜곡시키고 모델의 정확성을 저하시킬 수 있으며, 이로 인해 중요한 패턴을 감추거나 왜곡할 수 있습니다. 이상값 발생 원인: 이상값은 주로 측정 오류, 이상치 데이터 입력, 자연적인 변동, 이상치 자체의 특이성 등 다양한 요인으로 인해 발생할 수 있습니다. 예를 들어, 센서 오작동, 사람의 실수, 현상의 예외적인 동작 등이 있습니..

이번 포스팅에선 분석과 시각화를 해보는 마지막 포스팅으로, 여러 가지 주식 기술 기법들과 지표들을 확인해 보겠습니다. 일별 수익률과 이동평균, 변동성 지표 볼린저 밴드와 % 밴드, RSI, MACD 등의 기법과 지표를 사용해 보겠습니다. 이번 프로젝트와 포스팅의 목표는 해당 주식 기법들을 이해하겠다기 보다는, 이런 기법들이 있고 이것을 저희가 파이썬을 사용해서 어떻게 데이터를 수집하고 전처리를 하며 시각화를 해서 한눈에 알아본다 에 있습니다. 데이터 수집 해당 포스팅에선 주식코드가 '005930'인 삼성전자의 주가로 수집하여 진행해 보겠습니다. 데이터 전처리 Shift를 활용하여 전일 대비 수익률을 구해봅시다. 그리고 pandas의 pct_change를 사용하여 구하고 이를 시각화 하여 확인해 봅니다 이..