목록맛집 List (340)
Allen's 데이터 맛집
이전 포스트에 이어서 포스팅하겠습니다. [5] 하체 벌크업 : 그래프를 통한 분석 결과 - 2 이전 포스트에 이어서 포스팅하겠습니다. [4] 하체 벌크업 : 그래프를 통한 분석 결과 - 1 이전 포스팅에서는 데이터를 수집하고 전처리하는 과정을 진행했습니다. 이제는 그 데이터를 가지고 실 allensdatablog.tistory.com 휴식기간과 1RM 중량의 연관성 운동과 휴식 기간의 관계: 운동과 휴식 기간의 상관관계를 분석하여, 얼마나 휴식 기간을 가지고 운동을 하고 있는지 확인할 수 있습니다. 더 많은 휴식 기간이 높은 1RM과 연관이 있는지, 또는 그렇지 않은지 알아볼 수 있습니다. 지난 포스팅에서 운동 데이터를 분석하며 몸무게와 1RM 중량 간의 강한 상관관계를 확인했습니다. 그런데 더 깊게 파..
이번 포스팅에선 Kaggle의 'E-Commerce Shipping Data'의 고객 구매 데이터를 사용해서 고객이 주문한 물품이 제시간에 도착하였는지 여부(Reached.on.Time_Y.N)를 예측해 보겠습니다. About Dataset Context An international e-commerce company based wants to discover key insights from their customer database. They want to use some of the most advanced machine learning techniques to study their customers. The company sells electronic products. Content The data..
이번 포스팅에서는 빅데이터 분석기사의 실제 분류 문제를 가지고 데이터 분석 및 예측을 진행해 보겠습니다. 문제 고객 3,500명에 대한 학습용 데이터(y_train.csv, X_train.csv)를 이용하여 성별예측 모형을 만든 후, 이를 평가용 데이터(X_test.csv)에 적용하여 얻은 2,482명 고객의 성별 예측값(남자일 확률)을 다음과 같은 형식의 csv 파일로 생성하시오. (제출한 모델의 성능은 ROC-AUC 평가지표에 따라 채점) 데이터 가져오기 데이터를 받아오고 각종 세팅을 한 다음 X, Y, X_submission 변수에 각 train, test csv 데이터들을 담습니다. 데이터 전처리 X데이터를 결합하고 info()를 통해 데이터 타입을 확인하고, 추가로 결측치까지 확인합니다. '환불..
"뛰어난 예측의 힘, XGBoost 분류 모델" 이번에는 머신러닝 분야에서 현재 굉장히 인기 있는 'XGBoost' 분류 모델에 대해 알아보겠습니다. XGBoost는 예측 성능을 극대화하고 과적합을 줄이는 데에 뛰어난 성능을 보이는 알고리즘입니다. XGBoost는 Gradient Boosting 알고리즘을 기반으로 한 앙상블 모델로, 여러 개의 결정 트리를 조합하여 예측을 수행합니다. 트리를 순차적으로 생성하면서, 이전 트리의 예측 오차를 보완하는 방식으로 학습됩니다. 이미지출처:https://m.blog.naver.com/winddori2002/221931868686?view=img_1 간단한 파이썬 코드 예제: from sklearn.datasets import load_iris from xgboos..