목록Project/Kaggle 분석&기계학습 (12)
Allen's 데이터 맛집
전자상거래 배송 데이터 이번 포스팅에선 빅데이터 분석기사의 예제문제인 분류 문제를 가지고 분류예측모델을 만들어보겠습니다. 제품 배송 시간에 맞춰 배송되었는지 예측모델 만들기 학습용 데이터 (X_train, y_train)을 이용하여 배송 예측 모형을 만든 후, 이를 평가용 데이터(X_test)에 적용하여 얻은 예측 확률값을 다음과 같은 형식의 CSV파일로 생성하시오(제출한 모델의 성능은 ROC-AUC 평가지표에 따라 채점) ID, Reached.on.Time_Y.N 4733,0.6 2040,0.8 5114,0.45 2361,0.23 5996,0.43 [시험용 데이터셋 만들기] 코드는 예시문제와 동일한 형태의 X_train, y_train, X_test 데이터를 만들기 위함임 (유의사항) 성능이 우수한 예..
Mercedes Used Car Listing "How much my friend should sell his old Mercedes" 이번 포스팅에선 케글의 'Mercedes Used Car Listing'의 벤츠의 중고차 목록 데이터를 사용해서 중고 벤츠 차량이 얼마에 팔릴지를 분석하여 Price를 예측해 보는 프로젝트입니다 About Dataset Data set contains information of price, transmission, mileage, fuel type, road tax, miles per gallon (mpg), and engine size data description: model Mercedez model. year registraion year. price price ..
이번 포스팅에선 Kaggle의 'E-Commerce Shipping Data'의 고객 구매 데이터를 사용해서 고객이 주문한 물품이 제시간에 도착하였는지 여부(Reached.on.Time_Y.N)를 예측해 보겠습니다. About Dataset Context An international e-commerce company based wants to discover key insights from their customer database. They want to use some of the most advanced machine learning techniques to study their customers. The company sells electronic products. Content The data..
이번 포스팅에서는 빅데이터 분석기사의 실제 분류 문제를 가지고 데이터 분석 및 예측을 진행해 보겠습니다. 문제 고객 3,500명에 대한 학습용 데이터(y_train.csv, X_train.csv)를 이용하여 성별예측 모형을 만든 후, 이를 평가용 데이터(X_test.csv)에 적용하여 얻은 2,482명 고객의 성별 예측값(남자일 확률)을 다음과 같은 형식의 csv 파일로 생성하시오. (제출한 모델의 성능은 ROC-AUC 평가지표에 따라 채점) 데이터 가져오기 데이터를 받아오고 각종 세팅을 한 다음 X, Y, X_submission 변수에 각 train, test csv 데이터들을 담습니다. 데이터 전처리 X데이터를 결합하고 info()를 통해 데이터 타입을 확인하고, 추가로 결측치까지 확인합니다. '환불..