목록Project/코로나 데이터분석 (6)
Allen's 데이터 맛집
이번 '코로나 데이터 분석' 프로젝트를 통해, 데이터의 힘과 그 해석의 중요성을 다시 한번 체감할 수 있었습니다. Python이 아닌 SQL을 사용하여 데이터를 다뤄보는 시도를 통해 다양한 쿼리를 작성해 보았습니다. 이를 통해 현업에서 요구되는 실무 능력을 향상하는 과정이었고, 데이터 분석가로서 꾸준한 SQL 공부의 필요성을 느꼈습니다. Tableau를 사용하여 효과적인 대시보드를 만들어 보는 좋은 경험이었고, 이는 데이터를 효과적으로 전달하는 데 큰 도움이 되었습니다. 또한 이를 통해 감염 상황에 대한 인사이트를 얻었습니다. 이 프로젝트를 통해 데이터를 다루는 능력뿐만 아니라, 비즈니스에 적용할 수 있는 실용적인 인사이트를 발굴하는 과정에서 분석적 사고의 중요성을 깨달았습니다. 또한, 새로운 도구와 기..

코로나 데이터분석의 마지막 단계로, 지금까지 SQL로 다양한 EDA를 해 본 것을 Tableau라는 강력한 시각화 프로그램을 사용하여 시각화를 해 보았습니다. 각각의 분석 결과와, 한눈에 코로나 상황을 시각적으로 볼 수 있는 대시보드를 만들어 보았습니다. 분석결과 시각화 1. 전 세계의 총 감염자수, 총 사망자수, 사망률 분석 결과를 파악합니다. 2. 전 세계와의 추가 비교 분석을 위해 대한민국의 사망률 분석 결과를 파악합니다. 한국의 감염률은 매우 상위권을 기록했지만, 심각성을 파악하기 위해 추가로 사망률 분석 해보았습니다. 그 결과 전 세계 사망률의 1/9로 매우 낮은 사망률을 보여줌으로써. 이러한 여러 지표를 통해 한국의 코로나 상황이 심각하지 않음을 검증할 수 있었습니다. 3. 대륙별 총사망자 수..

이번 포스에선 이전 포스팅과 같이, SQL을 사용하여 Tableau에서 시각화를 위해 EDA를 통해 데이터를 분석해 보았습니다. 1. 전 세계의 총 감염자수와 총 사망자수 데이터를 가지고 사망률을 파악해 봅니다. 전 세계 코로나 사망률은 상대적으로 낮은 0.90%이지만 이는 아직 큰 영향을 미치고 있음을 시사합니다. Select SUM(new_cases) as total_cases, SUM(cast(new_deaths as int)) as total_deaths, SUM(cast(new_deaths as int))/SUM(New_Cases)*100 as DeathPercentage From PortfolioProject..CovidDeaths where continent is not null order ..

이번 프로젝트의 중요 목표 중 하나로, 이전 프로젝트들과 같이 Python을 사용하지 않고 SQL만을 사용하여 EDA를 해보겠습니다. 이를 위해 MSSQL을 사용하기 위해 SSMS(SQL Server Management Studio) 프로그램으로 진행하였습니다. 1. 이번 프로젝트에서 가장 많이 쓰일 컬럼 [Location, date, total_cases, new_cases, total_deaths, population]을 조회하여 데이터들을 파악합니다. Select Location, date, total_cases, new_cases, total_deaths, population From PortfolioProject..CovidDeaths Where continent is not null order..