목록Project (56)
Allen's 데이터 맛집
이전 포스팅에서는 데이터를 수집하고 전처리하는 과정을 진행했습니다. 이제는 그 데이터를 가지고 실질적인 분석을 시작해 보겠습니다. 목표는 단순한 시각화를 넘어, 통계적인 결과를 도출하는 것입니다. 또한, 포트폴리오를 제작을 위해 사용해 볼 수 있는 핵심적인 시각화 기법들을 전부 활용하는 것이 목표입니다. 이번 분석에 사용한 데이터는 운동을 통해 하체 근육을 강화하고 특히 1RM 증량을 원하시는 분들을 위한 것입니다. 몸무게는 변화를 추적하기 위해 주기적(22.12 ~ 23.05)으로 기록하였고, 이번 하체 다이어트 편에 선스쾃/데드리프트 1RM 중량을 데이터를 조사하여 데이터를 분석하였습니다. 히스토그램과 밀도 그래프 먼저, 각각의 운동에 대한 중량을 히스토그램과 밀도 그래프로 시각화하여 분포를 확인합니..
이전 포스트에 이어서 포스팅하겠습니다. [5] 하체 벌크업 : 그래프를 통한 분석 결과 - 2 이전 포스트에 이어서 포스팅하겠습니다. [4] 하체 벌크업 : 그래프를 통한 분석 결과 - 1 이전 포스팅에서는 데이터를 수집하고 전처리하는 과정을 진행했습니다. 이제는 그 데이터를 가지고 실 allensdatablog.tistory.com 휴식기간과 1RM 중량의 연관성 운동과 휴식 기간의 관계: 운동과 휴식 기간의 상관관계를 분석하여, 얼마나 휴식 기간을 가지고 운동을 하고 있는지 확인할 수 있습니다. 더 많은 휴식 기간이 높은 1RM과 연관이 있는지, 또는 그렇지 않은지 알아볼 수 있습니다. 지난 포스팅에서 운동 데이터를 분석하며 몸무게와 1RM 중량 간의 강한 상관관계를 확인했습니다. 그런데 더 깊게 파..
이번 포스팅에선 Kaggle의 'E-Commerce Shipping Data'의 고객 구매 데이터를 사용해서 고객이 주문한 물품이 제시간에 도착하였는지 여부(Reached.on.Time_Y.N)를 예측해 보겠습니다. About Dataset Context An international e-commerce company based wants to discover key insights from their customer database. They want to use some of the most advanced machine learning techniques to study their customers. The company sells electronic products. Content The data..
이번 포스팅에서는 빅데이터 분석기사의 실제 분류 문제를 가지고 데이터 분석 및 예측을 진행해 보겠습니다. 문제 고객 3,500명에 대한 학습용 데이터(y_train.csv, X_train.csv)를 이용하여 성별예측 모형을 만든 후, 이를 평가용 데이터(X_test.csv)에 적용하여 얻은 2,482명 고객의 성별 예측값(남자일 확률)을 다음과 같은 형식의 csv 파일로 생성하시오. (제출한 모델의 성능은 ROC-AUC 평가지표에 따라 채점) 데이터 가져오기 데이터를 받아오고 각종 세팅을 한 다음 X, Y, X_submission 변수에 각 train, test csv 데이터들을 담습니다. 데이터 전처리 X데이터를 결합하고 info()를 통해 데이터 타입을 확인하고, 추가로 결측치까지 확인합니다. '환불..