관리 메뉴

Allen's 데이터 맛집

이산형 확률분포 - 이항분포, 포아송분포, 기하분포, 산술분포 본문

Data Analysis/통계&분석

이산형 확률분포 - 이항분포, 포아송분포, 기하분포, 산술분포

Allen93 2023. 12. 15. 02:52

이산형 확률 분포는 확률 변수가 이산적인 값을 가지며, 각 값에 대한 확률이 정의된 분포를 의미합니다. 이러한 분포는 유한하거나 셀 수 있는 값들의 집합에 대해 확률을 할당하며, 각 값의 확률의 합은 1이 됩니다. 주사위 던지기나 동전 던지기와 같은 간단한 예시부터, 여러 번의 독립적인 시행에서 어떤 사건이 일어날 때까지의 횟수 등을 모델링할 때까지 다양한 형태로 활용됩니다. 이산형 확률 분포는 확률 이론, 통계, 머신 러닝 등에서 데이터의 특성을 이해하고 예측하는 데에 중요한 도구로 활용됩니다.

 



1. 베르누이 분포 (Bernoulli Distribution):


정의: 베르누이 분포는 두 가지 결과 중 하나가 일어날 때 사용되는 분포입니다. 예를 들어 동전 던지기에서 앞면(성공)이 나올 확률을 p로 표시하면, 베르누이 분포는 다음과 같이 정의됩니다.
확률 질량 함수 (PMF):


예시: 동전 던지기에서 앞면이 나올 경우를 1로, 뒷면이 나올 경우를 0으로 나타낼 때의 확률 분포.

 

 

 

 

2. 이항 분포 (Binomial Distribution):


정의: 이항 분포는 독립적인 베르누이 시행을 여러 번 반복할 때, 특정 횟수의 성공(성공 확률 p)이 나타날 확률을 나타냅니다.
확률 질량 함수 (PMF): 


예시: 동전을 10번 던질 때 앞면이 3번 나올 확률.

 

 


3. 포아송 분포 (Poisson Distribution):


정의: 포아송 분포는 일정 시간 또는 공간에서 발생하는 사건의 평균 발생 횟수가 주어졌을 때, 특정 시간 또는 공간에서 발생하는 사건의 확률을 나타냅니다.
확률 질량 함수 (PMF): 


예시: 1시간 동안 발생하는 전화 통화 횟수가 평균 5회일 때, 1시간 동안 3회의 통화가 발생할 확률.

 

 


4. 기하 분포 (Geometric Distribution):


정의: 기하 분포는 독립적인 베르누이 시행에서 처음으로 성공할 때까지의 시행 횟수를 나타냅니다.
확률 질량 함수 (PMF): 


예시: 동전을 던져 처음으로 앞면이 나올 때까지의 시행 횟수.

 

 


5. 산술 분포 (Arithmetic Distribution):


정의: 산술 분포는 등차 수열에서 등차가 1인 경우의 분포로, 1부터 n까지의 정수 값에 대한 확률 분포입니다.
확률 질량 함수 (PMF): 


예시: 주사위를 던져 나오는 값의 확률 분포.

 

 

 


이러한 이산형 분포들은 다양한 현상을 모형화하고 예측하는 데에 사용됩니다. 예를 들어, 이항 분포는 동전 던지기나 시험에서의 성공 여부를 모델링할 때, 포아송 분포는 일정 시간 동안 도착하는 사건의 횟수를 모델링할 때 자주 사용됩니다.