Allen's 데이터 맛집
[0] Intro : 파이썬으로 증권 데이터 수집과 분석하기 본문
프로젝트를 들어가며
안녕하세요~ 현 개발자이며 데이터 분석가로 취직을 준비하고 있는 Allen입니다!
저의 블로그에 세 번째 프로젝트를 소개하겠습니다.
이전에 주식 투자 트레이딩 봇 프로젝트를 완료한 뒤에도 주식 관련 프로젝트를 선택한 이유는 데이터 분석을 통해 다양한 라이브러리들을 익힐 필요성을 느꼈기 때문이에요. 특히, 데이터 분석에서 빼놓을 수 없는 판다스는 증권 데이터 분석을 위해 탄생한 라이브러리로서, 이러한 이유로 금융 데이터를 활용한 추가적인 프로젝트를 진행해 보았습니다.
이전 프로젝트가 프로그래밍과 자동화, 그리고 구현에 중점을 두었다면, 이번 프로젝트에서는 데이터 수집을 위한 SQL, 데이터 전처리 및 분석에 활용되는 Pandas, Numpy와 시각화 도구들이 중요성을 갖는다는 것을 깨달았습니다. 현업에서 이미 사용 중인 SQL은 제외하고, Pandas, Numpy 및 다양한 시각화 도구들의 학습이 필요하다고 생각하여 인프런에서 강의를 통해 실제 데이터 분석에 더 가까운 스킬을 익혔습니다.
강의의 오픈코드를 참고할 수도 있었지만, 직접 코드를 작성하고 전처리, EDA, 시각화를 수행해 보는 것이 더욱 값진 경험이라고 생각하여, 강의에서 제공한 완성된 코드는 일절 사용하지 않았습니다. 또한 강의는 교육용 커리큘럼일 뿐이며, 제가 직접 궁금하고 분석하고 싶은 주제를 따로 공부하고 구현했습니다.
프로젝트 소개
해당 프로젝트는 증권 데이터를 활용하여 데이터 수집, 분석, 시각화에 초점을 맞추고 있습니다.
증권 데이터를 통해 데이터 수집, 전처리, 분석, 시각화를 어떻게 진행하는지에 대해 다양한 기술을 사용합니다.
시계열 데이터의 다양한 시각화 기법과 스케일 표현 방법, 주가 데이터를 해석하기 위한 기법들을 사용합니다. 더 나아가, 주가의 일별 수익률과 누적 수익률을 구하는 방법과 seaborn, plotly, pandas plot, matplotlib 등의 시각화 라이브러리를 활용하여 인터랙티브 한 시각화 기법도 사용하고 학습해 볼 수 있습니다.
데이터 전처리를 위한 판다스의 filter, merge, concat, text 전처리 방법도 알아보고, ETF와 업종/테마 전종목을 수집하고 분석합니다. 더불어 볼린저밴드, MACD, RSI 등의 기술적 보조지표를 직접 구현하고 원리를 이해하는 과정도 구현해 봅니다.
프로젝트 목표
이 프로젝트는 데이터 분석과 시각화를 통해 불확실한 미래를 예측하고 인사이트를 찾고자 하는 분들에게 좋을것 같습니다. 또한, 파이썬을 이용한 데이터 분석에 입문하고자 하는 분들에게 좋은 프로젝트입니다.
FinanceDataReader를 사용하여 한 줄로 주가 정보를 수집하고, 판다스를 활용하여 데이터를 쉽게 핸들링합니다. 또한, 복잡한 웹 스크래핑 없이도 브라우저의 네트워크 탭을 이용하여 데이터를 수집합니다.
개인 프로젝트로 만들면서 데이터 기초 능력을 기르고, 증권 데이터로부터 다양한 인사이트를 발굴하는 데에 도움이 되는 것을 목표로 합니다.
GITHUB : https://github.com/siilver94/Stock-data-collection-analysis-and-visualization