목록Project (61)
Allen's 데이터 맛집
프로젝트 소개: 코로나 데이터 분석 데이터 분석을 향한 열정을 품은 Allen입니다😀 이번에 제가 진행한 '코로나 데이터 분석' 프로젝트는 세계적으로 대유행이었고, 현재도 진행 중인 코로나바이러스에 대한 통계를 얻기 위한 분석 프로젝트입니다. 이 프로젝트는 MSSQL과 Tableau를 활용하여 세계 각국의 코로나 데이터를 탐색하고 분석하는 것을 목표로 하고 있습니다. 이 프로젝트는 시작한 것은 물론 코로나 자체에 궁금증과 관심도 있었지만, 글로벌 데이터를 사용하여 실무에서 필요한 핵심 역량(SQL, 시각화)을 사용하여 분석을 해 보는 것에 초점을 맞춰 보았습니다. 실전 SQL 활용: 이전처럼 Python이 아닌, SQL 쿼리를 사용하여 데이터를 조작, 분석해 봅니다. SQL은 SSMS(SQL Server..
22년 6월에 시작을 하여 23년 11월에 끝이 난 17개월이라는 장기간에 걸친 프로젝트를 통해 저는 몸무게와 1RM 중량 사이의 상관관계를 깊이 있게 분석하고자 했습니다. 처음부터 이 두 변수 간의 연관성을 확인하고 싶었고, 특히 벌크업 시즌과 다이어트 시즌에서의 데이터 분석 결과가 어떻게 다른지 알아보고 싶었던 것이 주된 이유였습니다. 사실 프로젝트를 시작할 때는 벌크 시즌의 체중 변화로부터 보이는 데이터를 분석하고자 했지만, 추후에 다이어트를 할 때의 분석결과도 궁금하여서 추가로 다이어트를 진행해 보았고 이 시즌에 데이터를 수집하느라 프로젝트가 연장되었습니다. 이왕 데이터 수집을 하는 김에 몸무게와 1RM 중량 외에 상관관계가 있을 수도 있겠다 생각한 요소인 휴식기간, 운동하는 시간을 추가하였습니다..
About Dataset Context and Content A company which is active in Big Data and Data Science wants to hire data scientists among people who successfully pass some courses which conduct by the company. Many people signup for their training. Company wants to know which of these candidates are really wants to work for the company after training or looking for a new employment because it helps to reduce..
대학원 입학 예측(회귀) 데이터를 가지고 대학원에 입학할 확률을 구해보겠습니다. 예측할 값(target): "Chance of Admit " 평가: r2 data(3개): t2-2-X_train, t2-2-y_train, t2-2-X_test 제출 형식(Serial No.-> id, 예측 값 -> target) id, target 28,0.741696 76,0.779616 151,0.897247 데이터 불러오기 각각 데이터를 불러옵니다. import pandas as pd # 데이터 불러오기 X_train = pd.read_csv("../input/big-data-analytics-certification/t2-2-X_train.csv") y_train = pd.read_csv("../input/big-..