목록빅분기 (11)
Allen's 데이터 맛집

생존여부 예측모델 만들기 학습용 데이터 (X_train, y_train)을 이용하여 생존 예측 모형을 만든 후, 이를 평가용 데이터(X_test)에 적용하여 얻은 예측값을 다음과 같은 형식의 CSV파일로 생성하시오. (제출한 모델의 성능은 accuracy 평가지표에 따라 채점) (가) 제공 데이터 목록 y_train: 생존여부(학습용) X_trian, X_test : 승객 정보 (학습용 및 평가용) (나) 데이터 형식 및 내용 y_trian (712명 데이터) 시험환경 세팅은 예시문제와 동일한 형태의 X_train, y_train, X_test 데이터를 만들기 위함임 유의사항 성능이 우수한 예측모형을 구축하기 위해서는 적절한 데이터 전처리, 피처엔지니어링, 분류알고리즘, 하이퍼파라미터 튜닝, 모형 앙상블..

케글 데이터를 가지고 머신러닝 분류모델을 사용하여 여행 보험 패키지 상품을 구매할 확률 값을 예측해 보겠습니다. 문제 : 여행 보험 패키지 상품을 구매할 확률 값을 구하시오 예측할 값(y): TravelInsurance (여행보험 패지지를 구매했는지 여부 0:구매 안 함, 1:구매) 평가: roc-auc 평가지표 data: t2-1-train.csv, t2-1-test.csv 제출 형식 id, TravelInsurance 0, 0.3 1, 0.48 2, 0.3 3, 0.83 시험 환경 셋팅 train 데이터와 test 데이터를 가져옵니다. # 라이브러리 불러오기 import pandas as pd # 데이터 불러오기 train = pd.read_csv("../input/big-data-analytics-..

전자상거래 배송 데이터 이번 포스팅에선 빅데이터 분석기사의 예제문제인 분류 문제를 가지고 분류예측모델을 만들어보겠습니다. 제품 배송 시간에 맞춰 배송되었는지 예측모델 만들기 학습용 데이터 (X_train, y_train)을 이용하여 배송 예측 모형을 만든 후, 이를 평가용 데이터(X_test)에 적용하여 얻은 예측 확률값을 다음과 같은 형식의 CSV파일로 생성하시오(제출한 모델의 성능은 ROC-AUC 평가지표에 따라 채점) ID, Reached.on.Time_Y.N 4733,0.6 2040,0.8 5114,0.45 2361,0.23 5996,0.43 [시험용 데이터셋 만들기] 코드는 예시문제와 동일한 형태의 X_train, y_train, X_test 데이터를 만들기 위함임 (유의사항) 성능이 우수한 예..