목록Project/미세먼지 분석 (6)
Allen's 데이터 맛집

미세먼지 분석 프로젝트의 마지막 포스팅으로서 분석 결과와 저의 리뷰를 포스팅하겠습니다 1. 2016년도 미세먼지 동향: [3, 4월에 미세먼지 농도가 높았으며, 특히 4월이 가장 높았다.] 4월에 높은 미세먼지 농도는 봄철에 대기 중 미세먼지 발생이 증가하는 경향이 있을 것으로 예측됩니다. 이는 온난화로 인한 온도 상승이나 특정 기상 조건과 관련이 있을 수 있습니다. 2. 2016~2018 월별 미세농도 추이: [2016년의 미세농도가 2017년, 2018년에 비해 높았음을 확인. 전반적으로 2018년이 다른 연도에 비해 미세먼지 농도가 낮았다.] 2018년에 미세먼지 농도가 감소한 이유로는 환경 정책이나 대기 오염 관리의 효과가 있을 수 있습니다. 정부나 지자체에서 시행한 대기환경 관리 정책, 산업 구..

이번 포스팅에선 미세먼지 데이터로 전처리와 분석을 끝냈으니 마지막 단계인 시각화를 통해 알아보겠습니다 미세먼지 데이터를 시각화하기 위해서 데이터를 불러오기부터 분석을 위한 간단한 전처리를 해주겠습니다. 연/월별 미세먼지 농도의 평균을 data의 새로운 데이터프레임으로 저장합니다. 2016년도에는 3,4월에 미세먼지 농도가 높았고 특히 4월달의 미세먼지 농도가 높았음을 확인할 수 있습니다. 이번에는 2016년에서 2018년까지 월별 미세농도 추이 그래프를 그려보았습니다. 확실히 2016년도의 미세농도가 다른 연도에 비해서 높음을 확인할 수 있고 전반적으로 2018년도가 떨어짐을 확인할 수 있습니다. 이를 통해 연도별 월별 미세먼지 농도의 차이를 한눈에 파악할 수 있습니다. 2016년~2018년의 월별 미세..

이번 포스팅에서는 이전에 전처리한 데이터를 가지고 본격적인 분석을 해보도록 하겠습니다. 데이터의 소수점 2 자릿수까지만 출력 설정 후 데이터를 년/월에 맞춰 mean, min, max 값의 미세먼지 데이터를 출력하여 확인합니다. 분석목표에서 말했듯 강남구의 데이터로 분석을 시행하겠습니다. 강남구의 년/월별 미세머지 농도의 평균을 조회하여 temp로 저장합니다. 년/월로 그룹화 하여 미세먼지의 평균 데이터를 조회하여 확인해 봅니다. 2016년부터 2020년까지 미세먼지 농도가 가장 높은 월을 출력합니다. 2019년 데이터 중 1~7월이 없기 때문에 12월이 나옵니다. 연별/월별 미세먼지 평균을 구해서 temp로 저장합니다. 미세먼지 2020 칼럼을 추가합니다. '차이'라는 컬럼을 추가하여 미세먼지의 평균값..

파일 준비하기 [data_day_2016.xlsx, data_day_2017.xlsx, data_day_2018.xlsx, data_day_2019.xlsx] 파일을 가져오고 이를 확인합니다. 각 파일에 기록되어 있는 내용 - 측정일시, 측정소명, 이산화질소농도, 오존농도, 이산화탄소농도, 아황산가스, 미세먼지, 초미세먼지의 측정치 결측치 처리 2016년부터 2019년까지 파일을 합친 다음 데이터 분석을 위해 인덱스를 설정하고, 측정일시를 datetime형태로 변환합니다. 그리고 데이터 결측치 개수를 각각 확인합니다. 시각화(Heatmap)를 통하여 결측치를 좀 더 명확히 확인합니다. 연/월별 미세먼지 데이터의 평균을 새로운 데이터프레임에 넣고 저장합니다. 2017년 6월까지 데이터만 출력해 봅니다. '..