목록Project (61)
Allen's 데이터 맛집
이번 포스팅부터 본격적인 분석에 앞서 직접 수집한 데이터를 불러오고 탐색하여 필요하다면 전처리를 진행해 보겠습니다. 개인적으로 분석 하기 전 시각화 테스트를 해 보는 과정입니다.먼저 그래프에서 한글과 - 기호가 잘 출력되는지 확인을 합니다. 그리고 데이터를 불러와서 info(), describe() 함수를 사용하여 데이터타입, 결측치, 이상치 그리고 데이터를 요약하여 파악합니다.데이터 칼럼은 이전 포스팅에서 언급한 대로 ID값, 날짜, 몸무게, 스쾃 1rm중량, 데드리프트 1rm중량, 휴식기간(일), 운동을 한 시간대 가 있습니다.DateTime 빼고는 모두 수치형 데이터입니다.Describe() 함수를 통해 통계치를 확인할 수 있고 직접 입력한 데이터 이므로 결측치는 존재하지 않습니다.'ID', 'Da..
여러 가지 수많은 데이터들이 산재되어 있지만 내가 직접 수집할 데이터를 선택하여 수집하고 그것을 바탕으로 데이터 분석을 하는 것만큼 의미 있는 것이 있을까 해서 내가 직접 모든 데이터를 쌓아본다! 쌓을 데이터 목록 날짜 - DateTime 몸무게 - Weight 1rm중량 - Squat, Sumo Deadlift, OHP Pendlay Row 휴식기간(얼마만에 그 부위를 하는지) - Rest_Period(day) 운동 시간(오전/오후/저녘 : 0/1/2) - Workout_time : 06 ~ 12 : 1 / 12 ~ 18 : 2 /18 ~ 00 ; 3 추후 최대심박수, 평균 심박수 추가 예정 분석 목표 시간별 운동 선호도 분석: 오전/오후/저녁 중 어떤 시간대에 가장 많이 운동하는지, 그리고 계절이나 ..
🤩프로젝트를 시작한 계기 이 전에 했던주식 투자 자동화 트레이딩 봇을 진행하고 통계공부와 데이터 분석가 커뮤니티에서 활동을 하면서 제가 했던 것은 너무 개발자스러웠다는 것을 느꼈습니다. 해당 프로젝트에선 SQL은 없지만 구현이 목표인 프로그래밍보단 데이터를 수집하고 데이터를 전처리하고 활용하는데 쓰이는 Pandas, 그리고 여러 시각화 도구들이 더욱 중요함을 느꼈습니다. 그리하여, 인프런에서 강의를 통해 실제 데이터 분석에 좀 더 가까운 학습을 하고 개인 프로젝트를 만들었습니다. Intro글에서 말했든 강의에서 주는 답안지(코드가 전부 적혀있는)는 열어보지 않고 직접 하나하나 제가 구현을 하면서 다양한 웹 데이터 수집 방법, 그리고 다양한 전처리와 분석 그리고 더더욱 다양한 시각화 도구를 공부해 보았습니..
이번 포스팅에선 분석과 시각화를 해보는 마지막 포스팅으로, 여러 가지 주식 기술 기법들과 지표들을 확인해 보겠습니다. 일별 수익률과 이동평균, 변동성 지표 볼린저 밴드와 % 밴드, RSI, MACD 등의 기법과 지표를 사용해 보겠습니다. 이번 프로젝트와 포스팅의 목표는 해당 주식 기법들을 이해하겠다기 보다는, 이런 기법들이 있고 이것을 저희가 파이썬을 사용해서 어떻게 데이터를 수집하고 전처리를 하며 시각화를 해서 한눈에 알아본다 에 있습니다. 데이터 수집 해당 포스팅에선 주식코드가 '005930'인 삼성전자의 주가로 수집하여 진행해 보겠습니다. 데이터 전처리 Shift를 활용하여 전일 대비 수익률을 구해봅시다. 그리고 pandas의 pct_change를 사용하여 구하고 이를 시각화 하여 확인해 봅니다 이..