Allen's 데이터 맛집

연속형 확률분포 - 정규분포, 균등분포, 지수분포, t분포, χ 2분포, F분포 본문

Data Analysis/통계&분석

연속형 확률분포 - 정규분포, 균등분포, 지수분포, t분포, χ 2분포, F분포

Allen93 2023. 12. 29. 16:23


확률 분포는 어떤 변수가 어떤 값들을 가질 확률을 나타내는 함수입니다. 연속형 확률분포는 변수가 연속적인 값을 가지는 경우를 다루며, 여기서는 몇 가지 대표적인 연속형 확률분포를 살펴보겠습니다.

 



1. 정규분포 (Normal Distribution):
정규분포는 자연 현상에서 나타나는 많은 현상들을 설명하는 데 사용됩니다. 종 모양의 분포를 가지며, 평균과 표준 편차에 의해 모양이 결정됩니다. 

예를 들어, 학생들의 시험 점수는 정규분포를 따를 수 있습니다. 만약 평균이 70이고 표준 편차가 10이라면, 대부분의 학생들은 60과 80 사이의 점수를 얻을 것이며, 70에 가까운 점수를 얻는 학생이 가장 많을 것입니다.

2. 균등분포 (Uniform Distribution):
균등분포는 모든 값이 나타날 확률이 동일한 분포입니다.

동전을 던져 앞면이 나오거나 뒷면이 나올 확률은 각각 0.5로 동일합니다. 이는 균등분포의 예시입니다. 주사위 던지기도 유사한 예시로 볼 수 있습니다.

3. 지수분포 (Exponential Distribution):
지수분포는 사건이 발생하는 간격을 나타냅니다. 일정 시간 동안 사건이 발생하지 않을 확률이 감소하는 지수적인 특성을 가지고 있습니다.

도서관에서 학생들이 책을 빌리는 시간 간격을 고려해봅시다. 한 학생이 책을 빌린 후 다음 학생이 책을 빌리는 시간까지의 간격이 지수분포를 따를 수 있습니다.

4. t-분포 (t-Distribution):
t-분포는 작은 표본에서 평균에 대한 신뢰구간을 구할 때 사용됩니다. 표본 크기가 작을 때 정규분포를 가정하기 어려운 상황에서 사용됩니다.

만약 10명의 학생들이 있는데, 그들의 평균 키에 대한 신뢰구간을 구한다고 가정해봅시다. 표본이 작기 때문에 정규분포 대신 t-분포를 사용하여 신뢰구간을 계산할 수 있습니다.

5. 카이제곱 분포 (Chi-Square Distribution):
카이제곱 분포는 주로 분산에 대한 추정이나 독립성 검정에 사용됩니다. 표본 분산을 추정할 때 사용됩니다.

조사 대상자들이 다섯 가지 음료수 중 선호도를 나타내는 경우를 상상해봅시다. 이 경우에 카이제곱 분포를 사용하여 각 음료수의 선호도가 독립적인지를 검정할 수 있습니다.

6. F-분포 (F-Distribution):
F-분포는 두 모분산의 비율에 대한 추정에서 주로 사용됩니다. 분산 분석 등에서 유용하게 활용됩니다.

두 개의 그룹에서 추출한 표본의 분산 비율을 비교한다고 가정해봅시다. 이때 F-분포를 사용하여 두 그룹의 분산이 같은지 다른지를 검정할 수 있습니다.