목록맛집 List (410)
Allen's 데이터 맛집
표본 추출 관련 오차에는 다양한 종류가 있습니다. 주요한 세 가지 종류인 표본오차(표본 추출 오차), 비표본 오차, 그리고 표본 편의에 대해 설명하겠습니다. 1. 표본오차(표본 추출 오차, Sampling Error): 정의: 표본오차는 표본을 사용하여 모집단의 특성을 추정할 때 발생하는 오차로, 표본의 특성이 모집단의 특성과 어떻게 다를지를 나타냅니다. 원인: 무작위로 표본을 추출하기 때문에, 각 표본은 모집단을 정확하게 대표하지 못할 수 있습니다. 해결: 큰 표본을 사용하거나 효과적인 추출 방법을 사용하여 표본오차를 최소화할 수 있습니다. 2. 비표본 오차 (Non-Sampling Error): 정의: 비표본 오차는 주로 조사 과정에서 발생하는 오차로, 표본 추출 이외의 요인들로 인해 발생합니다. 원..

확률적 표본추출법은 표본을 추출할 때 각 원소가 표본에 선택될 확률이 정해져 있는 방법을 말합니다. 이 중에서 주로 사용되는 네 가지 확률적 표본추출법에 대해 설명하겠습니다. 출처:https://m.blog.naver.com/jongguman/220770217672 1. 단순 무작위 추출 (Simple Random Sampling): 설명: 모집단에서 무작위로 표본을 추출하는 방법입니다. 각 원소가 표본에 선택될 확률은 동일합니다. 과정: 무작위로 각 원소를 선택하여 표본을 구성합니다. 예시: 학급에서 학생들을 번호순이나 이름순으로 나열한 후, 무작위로 일정한 수의 학생을 선택하는 것. 2. 계통 추출 (Systematic Sampling): 설명: 모집단에서 일정한 간격으로 표본을 추출하는 방법입니다...

미세먼지 분석 프로젝트의 마지막 포스팅으로서 분석 결과와 저의 리뷰를 포스팅하겠습니다 1. 2016년도 미세먼지 동향: [3, 4월에 미세먼지 농도가 높았으며, 특히 4월이 가장 높았다.] 4월에 높은 미세먼지 농도는 봄철에 대기 중 미세먼지 발생이 증가하는 경향이 있을 것으로 예측됩니다. 이는 온난화로 인한 온도 상승이나 특정 기상 조건과 관련이 있을 수 있습니다. 2. 2016~2018 월별 미세농도 추이: [2016년의 미세농도가 2017년, 2018년에 비해 높았음을 확인. 전반적으로 2018년이 다른 연도에 비해 미세먼지 농도가 낮았다.] 2018년에 미세먼지 농도가 감소한 이유로는 환경 정책이나 대기 오염 관리의 효과가 있을 수 있습니다. 정부나 지자체에서 시행한 대기환경 관리 정책, 산업 구..

이번 포스팅에선 미세먼지 데이터로 전처리와 분석을 끝냈으니 마지막 단계인 시각화를 통해 알아보겠습니다 미세먼지 데이터를 시각화하기 위해서 데이터를 불러오기부터 분석을 위한 간단한 전처리를 해주겠습니다. 연/월별 미세먼지 농도의 평균을 data의 새로운 데이터프레임으로 저장합니다. 2016년도에는 3,4월에 미세먼지 농도가 높았고 특히 4월달의 미세먼지 농도가 높았음을 확인할 수 있습니다. 이번에는 2016년에서 2018년까지 월별 미세농도 추이 그래프를 그려보았습니다. 확실히 2016년도의 미세농도가 다른 연도에 비해서 높음을 확인할 수 있고 전반적으로 2018년도가 떨어짐을 확인할 수 있습니다. 이를 통해 연도별 월별 미세먼지 농도의 차이를 한눈에 파악할 수 있습니다. 2016년~2018년의 월별 미세..