안녕하세요!
통계하는 피터팬입니다.
이번 포스팅에서는 연속형 확률변수의 확률분포 몇 가지를 소개하도록 하겠습니다. 바로 지수 분포와 감마 분포에 대해 소개하도록 할 것입니다. 이산형 확률변수의 확률분포와는 달리 연속형 확률변수의 확률분포는 그 값 자체가 확률이 아닙니다. 즉, 확률 밀도 함수는 확률 질량 함수와는 달리 그 값이 확률을 의미하지는 않습니다. 실제로 확률 밀도 함수가 나오면 예를 들어 설명하도록 하겠습니다.
시작하겠습니다!
1. 지수 분포
통계학을 공부하셨거나, 공학분야에서 수명 분석 등을 공부해보신 분이라면 아마 한 번쯤 들어보셨을 거라고 생각합니다. 확률변수 X를 포아송 사건 사이에 대기시간이라고 정의하면 이러한 확률변수 X가 따르는 분포를 지수 분포라고 합니다. 여기에서 포아송 사건은 나중에 포아송 과정을 다룰 때 자세히 다루도록 하겠습니다. 단지 지금은 그냥 어떤 특정 사건과 사건 사이의 대기 시간이 따르는 확률분포 정도로 생각하시면 될 것 같습니다. 지수 분포의 경우 무기억성이라는 특이한 성질이 있습니다. 무기억성은 말 그대 록 기억을 못 한다고 생각하면 편리합니다. 무기억 서은 다음과 같은 성질을 의미합니다.
$$p(X> a+h|X> a) = p(X> h)$$
"이게 무슨 의미냐?"라고 의문을 가지시는 분들이 계실 거라고 생각합니다. 무기억성이라는 이름을 생각해보면 간단합니다. 예를 들어 설명하면, 어떤 키보드를 5년간 사용했다고 가정해보겠습니다. 5년간 사용한 키보드가 고장 날 확률은 새 키보드가 고장날 확률과 같다는 의미입니다. 어떻게 보면 상식적으로 받아들여지지 않는, 직관적이지 못한 성질이라고 생각하실 수 있습니다. 제가 공부하면서도 들었던 생각이기도 합니다. 그래서 찾아보니 수명을 분석에서는 와이블 분포가 더 많이 사용되고, 생존분석의 경우 다른 기법과 함수들이 자주 사용된다는 사실을 알게 되었습니다. 그러니 저런 성질이 있구나 정도로 생각하고 넘어가시면 될것 같습니다.
이제 지수 분포의 확률 밀도함수를 수식으로 표현하겠습니다. 참고로 평균이 $\beta $인 지수분포의 확률밀도 함수입니다.
$$ f(x) = \frac {1}{ \beta } e^{- \frac {x}{ \beta } } , x \geq 0 $$
여기에서 e는 자연상수 혹은 자연로그의 밑으로 무리수입니다. 제가 앞서 확률이 아니라고 했던 것은, 이전 포스팅인 이산형 확률변수의 확률분포와 비교하면서 보시면 이해하기 쉬운데, 일단 확률 질량 함수는 p(x)로 서술한 반면 확률 밀도 함수는 f(x)로 썼습니다. 즉, 확률 밀도 함수에 대해 f(x=a)는 확률이 아닙니다.
이제 다시 지수 분포로 돌아와 지수 분포의 평균과 분산에 대해 알아보겠습니다. 지수분포의 평균과 분산은 다음과 같습니다.
$$E(X) = \beta$$
$$Var(X) = \beta^2$$
분산이 평균의 제곱 형태임을 확인할 수 있습니다.
2. 감마 분포
다음으로 알아볼 분포는 감마 분포입니다. 지수 분포가 사건과 사건 사이의 분포였다면 감마 분포는 정수 n에 대해 n번의 사건들의 사이의 분포로 일반화시킬 수 있습니다. 단지 여기에서 중요한 점은 감마 분포를 위의 의미적 정의로만 정의할 수 있는 것은 아니므로, 정수 n대신 실수 $\alpha$를 이용해서 나타냅니다. 위 정의에서 알 수 있듯이 감마 분포에서 $\alpha =1$인 경우가 바로 지수 분포입니다. 지수 분포는 바로 감마 분포의 특수한 경우 입니다!! 이제 감마분포의 확률 밀도 함수를 알아보겠습니다.
$$f(x) = \frac {1}{ \Gamma ( \alpha ) \beta ^\alpha } x^{ \alpha -1} e^{- \frac {x}{ \beta } } , x \geq 0$$
여기에서 $\{Gamma ( \alpha )}$은 감마 함수로 우선 엄밀하게 생각하실 필요 없이
$$ \Gamma ( 1) = 1 $$정도만 알고 가시면 될 것 같습니다. (수식표현이 잘 안되어 저런형태로 밖에 쓰지 못 하였습니다. 방법을 아시는분은 댓글 부탁드리겠습니다. Latex를 사용할 수 있도록 코딩한 상태입니다.)지수분포의 확률밀도함수와 잘 비교해보시길 바랍니다. 감마분포의 $\alpha$자리에 1을 대입하면 그 결과가 일치한다는 사실을 발견할 수 있으실 겁니다! 이제 감마분포의 평균과 분산을 알아보도록 하겠습니다.
$$E(X) = \alpha \beta$$
$$Var(X) = \alpha \beta^2$$
역시나 $\alpha$자리에 1을 대입하면 지수분포의 평균과 분산의 결과와 완전히 일치하는 것을 확인할 수 있습니다.
제가 계속 뭔가의 특수한 경우, 혹은 확장된 경우를 위주로 설명하는 것을 느끼셨으면 좋겠습니다. 일단 이런 나무의 줄기를 잡아가고 이후에 조금 더 수학적인 증명과 자세한 내용을 붙여 나가면 공부하기 편하실 거라 생각합니다.
오늘은 여기까지 하겠습니다.
긴 글 읽어주셔서 감사합니다.
이 글을 읽는 분들 모두 파이팅!!
'통계, 인공지능 > 통계 관련' 카테고리의 다른 글
표본추출과 모집단 그리고 통계량 (0) | 2022.09.10 |
---|---|
확률분포의 여러가지 기댓값의 형태 (0) | 2022.09.06 |
이산형 균일분포와 음이항분포 (0) | 2022.09.06 |
베르누이 분포와 이항분포, 그리고 기하분포 (0) | 2022.09.06 |
확률변수의 기댓값과 표본 평균 (0) | 2022.09.05 |
댓글