목록전체 글 (340)
Allen's 데이터 맛집
이전 포스팅에서는 데이터를 수집하고 전처리하는 과정을 진행했습니다. 이제는 그 데이터를 가지고 실질적인 분석을 시작해 보겠습니다. 목표는 단순한 시각화를 넘어, 통계적인 결과를 도출하는 것입니다. 또한, 포트폴리오를 제작을 위해 사용해 볼 수 있는 핵심적인 시각화 기법들을 전부 활용하는 것이 목표입니다. 이번 분석에 사용한 데이터는 운동을 통해 하체 근육을 강화하고 특히 1RM 증량을 원하시는 분들을 위한 것입니다. 몸무게는 변화를 추적하기 위해 주기적(22.06 ~ 22.12)으로 기록하였고, 이번 하체 벌크업 편에선스쿼트/데드리프트 1RM 중량을 데이터를 조사하여 데이터를 분석하였습니다. 히스토그램과 밀도 그래프 먼저, 각각의 운동에 대한 중량을 히스토그램과 밀도 그래프로 시각화하여 분포를 확인합니다..
"주변의 친구를 물어보다, K-Nearest Neighbors 분류 모델" 이번에는 데이터 분류에 사용되는 머신러닝 알고리즘 중 하나인 'K-Nearest Neighbors(KNN)' 분류 모델에 대해 알아보려 합니다. 이 모델은 주변 데이터의 클래스를 참고하여 예측하는 간단하면서도 강력한 방법입니다. 이미지 출처 : https://bkshin.tistory.com/entry/%EB%A8%B8%EC%8B%A0%EB%9F%AC%EB%8B%9D-6-K-%EC%B5%9C%EA%B7%BC%EC%A0%91%EC%9D%B4%EC%9B%83KNN KNN 분류 모델은 주어진 데이터 포인트 주변의 k개의 이웃 데이터를 참고하여 예측을 수행합니다. 이웃 데이터 포인트들의 클래스 중 가장 많은 클래스를 현재 데이터 포인트의..
이번 포스팅부터 본격적인 분석에 앞서 직접 수집한 데이터를 불러오고 탐색하여 필요하다면 전처리를 진행해 보겠습니다. 개인적으로 분석 하기 전 시각화 테스트를 해 보는 과정입니다.먼저 그래프에서 한글과 - 기호가 잘 출력되는지 확인을 합니다. 그리고 데이터를 불러와서 info(), describe() 함수를 사용하여 데이터타입, 결측치, 이상치 그리고 데이터를 요약하여 파악합니다.데이터 칼럼은 이전 포스팅에서 언급한 대로 ID값, 날짜, 몸무게, 스쾃 1rm중량, 데드리프트 1rm중량, 휴식기간(일), 운동을 한 시간대 가 있습니다.DateTime 빼고는 모두 수치형 데이터입니다.Describe() 함수를 통해 통계치를 확인할 수 있고 직접 입력한 데이터 이므로 결측치는 존재하지 않습니다.'ID', 'Da..
여러 가지 수많은 데이터들이 산재되어 있지만 내가 직접 수집할 데이터를 선택하여 수집하고 그것을 바탕으로 데이터 분석을 하는 것만큼 의미 있는 것이 있을까 해서 내가 직접 모든 데이터를 쌓아본다! 쌓을 데이터 목록 날짜 - DateTime 몸무게 - Weight 1rm중량 - Squat, Sumo Deadlift, OHP Pendlay Row 휴식기간(얼마만에 그 부위를 하는지) - Rest_Period(day) 운동 시간(오전/오후/저녘 : 0/1/2) - Workout_time : 06 ~ 12 : 1 / 12 ~ 18 : 2 /18 ~ 00 ; 3 추후 최대심박수, 평균 심박수 추가 예정 분석 목표 시간별 운동 선호도 분석: 오전/오후/저녁 중 어떤 시간대에 가장 많이 운동하는지, 그리고 계절이나 ..