Allen's 데이터 맛집

[3] 데이터 불러오기, 탐색 및 전처리 본문

Project/데이터로 보는 나의 운동능력

[3] 데이터 불러오기, 탐색 및 전처리

Allen93 2023. 9. 4. 22:19

이번 포스팅부터 본격적인 분석에 앞서 직접 수집한 데이터를 불러오고 탐색하여 필요하다면 전처리를 진행해 보겠습니다.

 

개인적으로 분석 하기 전 시각화 테스트를 해 보는 과정입니다.

먼저 그래프에서 한글과 - 기호가 잘 출력되는지 확인을 합니다.

 

그리고 데이터를 불러와서 info(), describe() 함수를 사용하여 데이터타입, 결측치, 이상치 그리고 데이터를 요약하여 파악합니다.

데이터 칼럼은 이전 포스팅에서 언급한 대로 ID값, 날짜, 몸무게, 스쾃 1rm중량, 데드리프트 1rm중량, 휴식기간(일), 운동을 한 시간대 가 있습니다.

DateTime 빼고는 모두 수치형 데이터입니다.

Describe() 함수를 통해 통계치를 확인할 수 있고 직접 입력한 데이터 이므로 결측치는 존재하지 않습니다.

'ID', 'DateTime', 'Weight(kg)', 'Squat(kg)', 'Sumo_deadlift(kg)',
'Rest_Period(day)', 'Workout_time', 'Squat_Weight_per_kg', 'Deadlift_Weight_per_kg'

 

원활한 분석을 위해 DateTime 칼럼은 형변환을 해줍니다.

체중 대비 스쾃/데드리프트 중량을 보기 위해서 중량 / 몸무게로 새로운 칼럼을 만듭니다.

이를 통해서 체중대비 얼마나 많은 무게를 리프팅했는지 간편한 게 확인이 가능합니다.

스쾃/데드리프트 그리고 체중대비 스쾃/데드리프트를 정렬을 하여 출력합니다.

스쾃는 체중이 78.7kg일 때 제일 좋았지만, 데드리프트 그리고 체중대비 가장 높았던 것은 ID 23의 75.9kg이라는 것을 볼 수 있습니다. 이를 통해 체중만 높다고 중량을 높게 드는 것이 아니라는 것을 간접적으로 확인할 수 있습니다.

저는 75kg대에서 제일 체중대비 효율적으로 중량을 든 것을 확인할 수 있습니다.

 

Bulk_Lower_body.xlsx
0.01MB

 

 

GITHUB : https://github.com/siilver94/My-training-ability-as-driven-by-data

 

GitHub - siilver94/My-training-ability-as-driven-by-data

Contribute to siilver94/My-training-ability-as-driven-by-data development by creating an account on GitHub.

github.com

 

728x90