안녕하세요!!
통계하는 피터팬입니다.
이번 글에서는 이산형 확률변수의 대표적인 분포 몇 가지에 대해 설명하려고 합니다.
확률변수는 가질 수 있는 값을 기준으로 이산형 확률변수와, 연속형 확률변수로 나누어지게 됩니다. 그리고 이 글에서는 그 이산형 확률변수의 대표적인 확률분포 3 가지를 소개하도록 하겠습니다. 바로 베르누이 분포, 이항 분포, 기하 분포입니다. 대부분 이산형 확률변수를 공부하시면 처음으로 배우게 될 분포들입니다. 자세한 수학적 증명은 최대한 제외하고 내용 위주로 설명드리도록 하겠습니다.
시작하겠습니다!
1. 베르누이 분포
아마 가장 처음으로 배우시게 되는 확률분포라고 생각합니다. 베르누이 분포를 설명하기 앞서 살짝 설명드려야 하는 것이 베르누이 시행입니다. 베르누이 시행은 시행의 결과가 두 가지로 나타나는 경우를 의미합니다. 일반적으로 성공과 실패로 표현하며, 이런 경우에 표본 공간은 다음과 같이 나타낼 수 있습니다.
$$S = \big\{성공, 실패\big\} $$
이러한 경우에, 성공의 확률이 p라면 베르누이 시행에서 성공을 1에, 실패를 0에 대응시기는 확률변수를 베르누이 확률변수라고 합니다. 이러한 확률변수의 확률분포를 베르누이 분포라고 합니다. 베르누이 분포의 확률 질량 함수는 다음과 같습니다. (확률질량함수, 확률 밀도함수에 대한 이야기는 다른 포스팅에서 다루도록 하겠습니다.)
$$ p(x) = p^x(1-p)^{1-x} , x= 0,1 , 0\leq p \leq1 $$
참고로 확률 질량함수는 그 자체가 확률입니다. 베르누이 분포의 기댓값과 분산은 다음과 같습니다.
$$E(X) = p $$
$$Var(X) = p(1-p)$$
2. 이항 분포
일반적으로 이산 확률분포를 배우시게 되면 베르누이 분포 다음으로 배우게 되는 확률분포는 이항 분포입니다. 이항 분포는 성공확률이 p인 베르누이 시행을 독립적으로 n번 시행했을 때 성공 횟수를 확률변수 X라고 정의했을 때 이러한 확률변수의 확률분포를 이항 분포라고 합니다. 즉, 위 정의를 잘 살펴보면, 베르누이 확률변수 n개의 합을 의미함을 알 수 있습니다. 이항 분포의 확률변수는 다음과 같이 나타낼수 있습니다.
$$p(X=x) = \binom nx p^x(1-p)^{n-x} , x= 0,1, \ldots n, \; 0\leq p \leq1 $$
이러한 이항분포의 평균과 기댓값은 다음과 같습니다.
$$E(X) = np $$
$$Var(X) = np(1-p)$$
베르누이 분포와 비교를 해보면 앞의 n하나만 더 생겼다는 것을 알 수 있습니다. 이는 이항분포의 정의를 베르누이 확률변수의 합으로 나타낼 수 있기 때문에 나타나는 현상입니다. 자세한 내용은 기댓값의 성질에 대해 포스팅한 후 각 분포의 기댓값과 분산을 유도하는 과정을 포스팅할 때 설명하도록 하겠습니다.
3. 기하 분포
마지막으로 다룰 이산형 확률변수는 기하 분포입니다. 기하 분포는 성공확률이 p인 베르누이 시행에서 첫 번째 성공이 발생할 때까지의 실패 횟수를 확률변수 X라고 하면, 이 확률변수 X가 따른 확률분포입니다. 즉, 이런 확률변수 X의 값이 k라는 것은, k번 시행 이후 첫 번째 성공이 발생한다는 의미입니다. 이러한 확률분포는 다음과 같이 나타낼 수 있습니다.
$$p(X=k) = p(1-p)^{k} , k= 0,1, \cdots , \; 0\leq p \leq1 $$
기하 분포의 평균과 분산은 다음과 같습니다.
$$E(X) = \frac {1}{p} $$
$$Var(X) = \frac {1-p}{p^2} $$
너무 많은 분포들을 한 번에 배우게 되면 머리가 아프니 오늘은 이 3개만 설명하도록 하겠습니다. 참고로 베르누이 시행으로부터 위의 3가지 확률분포가 유도될 수 있음을 아셨으면 좋겠습니다. 나중에 수학적으로 증명하는 것을 포스팅할 예정이고 그때 이러한 사실을 알고 있다면 더 편하게 이해하실 수 있을 거라고 생각합니다.
긴 글 읽어주셔서 감사합니다.
이 글을 읽으시는 모든 분들께 정말 도움이 되었으면 좋겠습니다.
'통계, 인공지능 > 통계 관련' 카테고리의 다른 글
지수분포와 감마분포-두 분포의 관계설명을 포함한 (0) | 2022.09.06 |
---|---|
이산형 균일분포와 음이항분포 (0) | 2022.09.06 |
확률변수의 기댓값과 표본 평균 (0) | 2022.09.05 |
활용도가 높은 분할표 분석의 기초적인 검정 (0) | 2022.09.04 |
대표적인 몇가지 상황과 그에 따른 가설검정 방법 설명 (0) | 2022.09.04 |
댓글