목록Project/파이썬 증권 데이터 수집과 분석으로 신호와 소음 찾기 (7)
Allen's 데이터 맛집
🤩프로젝트를 시작한 계기 이 전에 했던주식 투자 자동화 트레이딩 봇을 진행하고 통계공부와 데이터 분석가 커뮤니티에서 활동을 하면서 제가 했던 것은 너무 개발자스러웠다는 것을 느꼈습니다. 해당 프로젝트에선 SQL은 없지만 구현이 목표인 프로그래밍보단 데이터를 수집하고 데이터를 전처리하고 활용하는데 쓰이는 Pandas, 그리고 여러 시각화 도구들이 더욱 중요함을 느꼈습니다. 그리하여, 인프런에서 강의를 통해 실제 데이터 분석에 좀 더 가까운 학습을 하고 개인 프로젝트를 만들었습니다. Intro글에서 말했든 강의에서 주는 답안지(코드가 전부 적혀있는)는 열어보지 않고 직접 하나하나 제가 구현을 하면서 다양한 웹 데이터 수집 방법, 그리고 다양한 전처리와 분석 그리고 더더욱 다양한 시각화 도구를 공부해 보았습니..

이번 포스팅에선 분석과 시각화를 해보는 마지막 포스팅으로, 여러 가지 주식 기술 기법들과 지표들을 확인해 보겠습니다. 일별 수익률과 이동평균, 변동성 지표 볼린저 밴드와 % 밴드, RSI, MACD 등의 기법과 지표를 사용해 보겠습니다. 이번 프로젝트와 포스팅의 목표는 해당 주식 기법들을 이해하겠다기 보다는, 이런 기법들이 있고 이것을 저희가 파이썬을 사용해서 어떻게 데이터를 수집하고 전처리를 하며 시각화를 해서 한눈에 알아본다 에 있습니다. 데이터 수집 해당 포스팅에선 주식코드가 '005930'인 삼성전자의 주가로 수집하여 진행해 보겠습니다. 데이터 전처리 Shift를 활용하여 전일 대비 수익률을 구해봅시다. 그리고 pandas의 pct_change를 사용하여 구하고 이를 시각화 하여 확인해 봅니다 이..

이번 포스팅에서는 제가 개인적으로 관심 있어하는 제약업종의 유사 업종과 테마로 분석해봅시다. 판다스의 read_html에 제약업종 url을 넣어 데이터를 수집하고 여러 전처리(결측치 처리, 파생변수 생성, 불필요한 칼럼제거)를 합니다. 전처리를 마친 데이터를 통해서 시가총액에 제일 높거나 거래량이 제일 높거나 등등 여러 가지 분석을 하고 시각화를 하는 것이 목표입니다. 데이터 수집 read_html에 2차 전지업종 url을 넣고 수집합니다. 데이터들이 table [2]에 있고 결측치를 모두 제거합니다. 종목명 대비 거래량을 bar chart로 그립니다. 상위 30개의 종목들을 시각화해봤을 때 이아이디라는 회사의 거래량이 압도적으로 많은 것을 확인할 수 있습니다. 하지만 거래대금으로 보았을 땐 거래량이 압..

네이버금융에서 ETF 목록 데이터를 수집하고 해당 데이터를 전처리해서 분석을 하고 시각화를 해봅시다! ETF 데이터 수집 수집, 분석 그리고 시각화를 할 라이브러리를 받아오고 requests 라이브러리로 네이버금융 url을 사용하여 찾고자 하는 목록 result와 etfitemlist을 받아와서 저희가 데이터를 EDA를 할 수 있게 키-값 형태의 데이터 프레임 형식으로 만듭니다 info() 함수를 사용하여 데이터들의 정보를 확인해 봅니다. etfTabCode는 해당 사이트에서 전체(0), 국내 시장지수(1), 국내 업종/테마(2), 국내 파생(3) ~ 해외 주식(4), 원자재(5), 채권(6), 기타(7)로 자료가 구분되어 있습니다. 저희는 앞으로 국내 시장지수를 가지고 분석 및 시각화를 할 것이기 때문..