목록Project (61)
Allen's 데이터 맛집
이번 포스팅에서는 빅데이터 분석기사의 실제 분류 문제를 가지고 데이터 분석 및 예측을 진행해 보겠습니다. 문제 고객 3,500명에 대한 학습용 데이터(y_train.csv, X_train.csv)를 이용하여 성별예측 모형을 만든 후, 이를 평가용 데이터(X_test.csv)에 적용하여 얻은 2,482명 고객의 성별 예측값(남자일 확률)을 다음과 같은 형식의 csv 파일로 생성하시오. (제출한 모델의 성능은 ROC-AUC 평가지표에 따라 채점) 데이터 가져오기 데이터를 받아오고 각종 세팅을 한 다음 X, Y, X_submission 변수에 각 train, test csv 데이터들을 담습니다. 데이터 전처리 X데이터를 결합하고 info()를 통해 데이터 타입을 확인하고, 추가로 결측치까지 확인합니다. '환불..
이전 포스팅에서 전처리했던 내용이 스쾃/데드리프트에서 OHP/바벨로우로 종목만 변경되어서 동일한 전처리를 사용하겠습니다. 핵심적인 시각화가 아닌, 제가 생각했을 때 통계를 낼 수 있는 것들과 사용할 수 있는 시각화를 전부 사용해 보는 것이 목표이고 추후 포트폴리오를 제작할 때 간추려서 만들 생각이니 참고 부탁드립니다. 데이터의 변화를 위해 증량을 한 데이터를 가지고 증량을 하였고 상체운동의 데이터를 사용하여 OHP/데드리프트의 1rm 중량을 가지고 분석을 하였습니다. 먼저 각 운동에 대한 중량을 히스토그램과 밀도 그래프로 표현하여 분포를 확인할 수 있습니다. 이를 통해 중량 분포의 모양과 분포 형태를 더 자세히 파악할 수 있습니다. OHP은 70kg 정도에 밀집되어 있고 바벨로우는102kg 정도에 밀집되..
이전 포스트에 이어서 포스팅하겠습니다. [4] 하체 벌크업 : 그래프를 통한 분석 결과 - 1 이전 포스팅에서는 데이터를 수집하고 전처리하는 과정을 진행했습니다. 이제는 그 데이터를 가지고 실질적인 분석을 시작해 보겠습니다. 목표는 단순한 시각화를 넘어, 통계적인 결과를 도출 allensdatablog.tistory.com 휴식기간과 1RM 중량의 연관성 운동과 휴식 기간의 관계: 운동과 휴식 기간의 상관관계를 분석하여, 얼마나 휴식 기간을 가지고 운동을 하고 있는지 확인할 수 있습니다. 더 많은 휴식 기간이 높은 1RM과 연관이 있는지, 또는 그렇지 않은지 알아볼 수 있습니다. 지난 포스팅에서 운동 데이터를 분석하며 몸무게와 1RM 중량 간의 강한 상관관계를 확인했습니다. 그런데 더 깊게 파고들어 보면..
이전 포스팅에서는 데이터를 수집하고 전처리하는 과정을 진행했습니다. 이제는 그 데이터를 가지고 실질적인 분석을 시작해 보겠습니다. 목표는 단순한 시각화를 넘어, 통계적인 결과를 도출하는 것입니다. 또한, 포트폴리오를 제작을 위해 사용해 볼 수 있는 핵심적인 시각화 기법들을 전부 활용하는 것이 목표입니다. 이번 분석에 사용한 데이터는 운동을 통해 하체 근육을 강화하고 특히 1RM 증량을 원하시는 분들을 위한 것입니다. 몸무게는 변화를 추적하기 위해 주기적(22.06 ~ 22.12)으로 기록하였고, 이번 하체 벌크업 편에선스쿼트/데드리프트 1RM 중량을 데이터를 조사하여 데이터를 분석하였습니다. 히스토그램과 밀도 그래프 먼저, 각각의 운동에 대한 중량을 히스토그램과 밀도 그래프로 시각화하여 분포를 확인합니다..