목록Project/Kaggle 분석&기계학습 (12)
Allen's 데이터 맛집
About Dataset Context This dataset is originally from the National Institute of Diabetes and Digestive and Kidney Diseases. The objective of the dataset is to diagnostically predict whether or not a patient has diabetes, based on certain diagnostic measurements included in the dataset. Several constraints were placed on the selection of these instances from a larger database. In particular, all ..
생존여부 예측모델 만들기 학습용 데이터 (X_train, y_train)을 이용하여 생존 예측 모형을 만든 후, 이를 평가용 데이터(X_test)에 적용하여 얻은 예측값을 다음과 같은 형식의 CSV파일로 생성하시오. (제출한 모델의 성능은 accuracy 평가지표에 따라 채점) (가) 제공 데이터 목록 y_train: 생존여부(학습용) X_trian, X_test : 승객 정보 (학습용 및 평가용) (나) 데이터 형식 및 내용 y_trian (712명 데이터) 시험환경 세팅은 예시문제와 동일한 형태의 X_train, y_train, X_test 데이터를 만들기 위함임 유의사항 성능이 우수한 예측모형을 구축하기 위해서는 적절한 데이터 전처리, 피처엔지니어링, 분류알고리즘, 하이퍼파라미터 튜닝, 모형 앙상블..
Q. [마케팅] 자동차 시장 세분화 자동차 회사는 새로운 전략을 수립하기 위해 4개의 시장으로 세분화했습니다. 기존 고객 분류 자료를 바탕으로 신규 고객이 어떤 분류에 속할지 예측해 주세요! 예측할 값(y): "Segmentation" (1,2,3,4) 평가: Macro f1-score data: train.csv, test.csv 제출 형식: ID,Segmentation 458989,1 458994,2 459000,3 459003,4 답안 제출 참고 아래 코드 예측변수와 수험번호를 개인별로 변경하여 활용 pd.DataFrame({'ID': test.ID, 'Segmentation': pred}).to_csv('003000000.csv', index=False) 노트북 구분 basic: 수치형 데이터만 ..
케글 데이터를 가지고 머신러닝 분류모델을 사용하여 여행 보험 패키지 상품을 구매할 확률 값을 예측해 보겠습니다. 문제 : 여행 보험 패키지 상품을 구매할 확률 값을 구하시오 예측할 값(y): TravelInsurance (여행보험 패지지를 구매했는지 여부 0:구매 안 함, 1:구매) 평가: roc-auc 평가지표 data: t2-1-train.csv, t2-1-test.csv 제출 형식 id, TravelInsurance 0, 0.3 1, 0.48 2, 0.3 3, 0.83 시험 환경 셋팅 train 데이터와 test 데이터를 가져옵니다. # 라이브러리 불러오기 import pandas as pd # 데이터 불러오기 train = pd.read_csv("../input/big-data-analytics-..