확률분포의 여러가지 기댓값의 형태
본문 바로가기
통계, 인공지능/통계 관련

확률분포의 여러가지 기댓값의 형태

by 통계하는 피터팬 2022. 9. 6.
반응형

안녕하세요!!

통계하는 피터팬입니다.

오늘은 확률변수의 여러가지 기댓값에대해 설명하도록 하겠습니다!! "기댓값이 기댓값이지 여러가지는 뭐냐?"라고 생각하시는 분도 계실거라고 생각합니다. 설명하겠지만, 기댓값의 정의는 하나가 있지만, 여러 활용의 형태에 따라 이름이 붙어서 여러가지 기대값이라고 서술하였습니다. 이번 포스팅에서 다룰 기댓값은 기댓값의 정의, 확률변수의 기댓값, 분산 이렇게 3가지 입니다. 그렇지만 여기에서 다룬 기댓값이 여러 기댓값의 전부는 아닙니다. 적률생성함수, 첨도, 왜도 등 더 다양한 형태의 기댓값들이 정의되어 있습니다. 그러므로 이 포스팅만 읽고 끝내지 마시고 제가 다음에 다룰 포스팅에서 다룰테니 꼭 그 글까지 읽어주시면 좋겠습니다.

이제 시작하겠습니다!!

 이 글에서는 편의상 이산형 확률변수가 아닌 연속형 확률변수를 가정하고 설명을 진행하도록 하겠습니다. 이산형의 경우 적분을 합의 형태로 바꾸면 됩니다. 또 확률변수 X의 확률밀도함수를 f(x)라고 가정하도록 하겠습니다.

 

1.기댓값의 정의

확률변수 g(X)의기댓값은 다음과 같은 정의를 가지고 있습니다.

$$E[g(X)] = \int_{- \infty }^ \infty  g(x)f(x)dx$$

즉, 확률변수 X의 함수인 g(X)의 기댓값의 정의입니다. 예를 들어 다음과 같은 문제를 풀게 될때 위의 식을 그대로 활용하면 됩니다.

"확률밀도 함수가 f(x) = 2x ($ 0 \leq x \leq 1$ ) 인 확률변수 X에 대해 $X^2$의 기댓값을 구하여라"

위와같은 문제는 다음과 같이 정의를 이용하여 쉽게 풀수 있습니다.

$$E(X^2) = \int_0^1  x^2 * 2xdx$$

$$=\int_0^1  2x^3dx = frac{1}{2} $$

2.확률변수 X의 기댓값

확률변수 X의 기댓값은 모평균과 같은 개념으로, g(x)=x인 경우입니다. 흔히 일반적으로 알고 있는 기댓값으로 이 포스팅을 이후로 제가 "기댓값"이라고 칭하는 것은 보통 이 기댓값을 의미합니다. 다음과 같은 문제를 풀 때 적용하면 되겠습니다.

"확률밀도함수가 f(x) = $ \frac{1}{ \beta } e^{- \frac{x}{ \beta } } $ 일때 기댓값을 구하여라"

위와 같은 문제를 풀때 다음과 같이 구할 수 있습니다. 고등학교 이과 혹은 미적분학에서 배우는 부분적분을 활용해야하는 부분은 생략하였습니다.

$$E(X) = \int_0^ \infty  x\frac{1}{ \beta } e^{- \frac{x}{ \beta } }dx $$

$$ = \beta $$

3.확률변수 X의 분산

g(x) = $(x-E(x))^2$인 경우 이를 확률변수의 분산이라고 합니다. 분산은 얼마나 기댓값으로 부터 떨어져있나, 혹은 떨어져 있는 정도를 수치적으로 표현한것입니다. 그래서 X-E(X)가 함수로 표현된 것입니다. 일반적으로 확률변수 X의 분산은 다음과 같이 표현합니다.

$$ Var(X) $$

분산의 정의를 살펴보면 다음과 같은 간편식을 유도할 수 있습니다.

$$Var(X) = \int_{- \infty }^ \infty  (x-E(x))^2f(x)dx$$

$$= \int_{- \infty }^ \infty  (x^2 - 2xE(x)+{E(x)}^2)f(x)dx$$

$$=\int_{- \infty }^ \infty  x^2f(x) - 2xE(x)f(x)+{E(x)}^2f(x)dx$$

$$=\int_{- \infty }^ \infty x^2f(x)dx -2E(X)\int_{- \infty }^ \infty xf(x)dx + {E(X)}^2 $$

$$=E[X^2] - {E(X)}^2$$

위와같은 간편식의 경우 계산이 편리하므로 문제를 풀때 사용하시면 좋을것 같습니다.

분산을 구하는 예시는 다음과 같은 것들이 있습니다.

"확률밀도함수가 f(x) = $ \frac{1}{ \beta } e^{- \frac{x}{ \beta } } $ 일때 분산을 구하여라"

위와 같은 문제를 풀때 다음과 같이 구할 수 있습니다. 위에서 유도한 간편식을 사용하도록 하겠습니다. 또, 기댓값 예시와 마찬가지로, 고등학교 이과 혹은 미적분학에서 배우는 부분적분을 활용해야하는 부분은 생략하였습니다.

$$E(X^2) = \int_0^ \infty  x^2\frac{1}{ \beta } e^{- \frac{x}{ \beta } }dx $$

$$ =2 {\beta}^2 $$

이므로

$$Var(X) = E[X^2] - {E(x)}^2$$

$$=2{\beta}^2 - {\beta}^2$$

$$={\beta}^2$$

이처럼 간펴식을 사용하면 직접 정의를 활용하여 구하는 것보다 쉬운경우가 많습니다. 


오늘은 여기까지 글을 서술하도록 하겠습니다. 글을 포스팅하면 할수록 무언가, 글을 참 못 쓴다는 생각과 이런 내용을 읽고 도움을 받는 사람이 있을까 하는 의문이 듭니다. 아직 블로그 초기라 이 글을 읽어주신 분들과 소통은 전혀하지 못 했지만... 그래도 이 글을 읽고 누군가에게는 도움이 됬으면 하는 작은 바람입니다. 또, 부족한것이 느껴지거나 이런내용은 꼭 추가하면 좋겠다 싶은 것들이 있으면 댓글을 달아주시면 감사하겠습니다. 점점 회의감이 느껴지고 있는것 같습니다. 그래도 최선을 다해 글을 쓰도록 하겠습니다. 제 목표는 일단 기본적인 수리통계학의 내용까지 다 다루는 것입니다. 시간이 오래 걸리겠지만, 끝까지 달려 보겠습니다!!

긴글 읽어주셔서, 푸념도 읽어주셔서 정말 감사드립니다.

이 글을 읽으시는 분들께 꼭 도움이 되었으면 좋겠습니다.

또 이글을 읽으시는 모든 분들 화이팅 입니다!

정말 감사합니다!

 

참고문헌

수리통계학- 나종화

수리통계학- 김우철

반응형

댓글


TOP

Designed by 티스토리