Intro
포아송 분포는 한 마디로 아래와 같습니다.
단위시간, 단위범위 당 사건 발생횟수 $\lambda$가 주어졌을 때, 주어진 시간 동안 사건이 $x$번 발생할 확률의 분포
오늘은 포아송 분포와 관계가 깊은 연속형 확률분포인 감마분포, 지수분포에 대해서 정리하겠습니다.
감마 분포
감마분포는 감마함수에 기반해서 만들어진 분포로, 우선 감마함수 먼저 알아보겠습니다. 감마함수는 아래와 같이 생겼습니다.
$\Gamma(\alpha)=\int_{0}^{\infty}x^{\alpha-1}e^{-x}dx, \alpha>0$
감마함수는 다음 몇가지 성질을 갖습니다.
$\Gamma(n)=(n-1)\Gamma(n-1)\ \rightarrow\ (n-1)(n-2)\dots(1)\Gamma(1)$
$\Gamma(n)=(n-1)!$
$\Gamma(1)=1$
$\Gamma(\frac{1}{2})=\sqrt{\pi}$
이러한 성질을 갖는 감마함수를 이용해서 만든 감마분포고, 감마분포의 확률밀도함수는 아래와 같습니다.
$$f(x;\alpha,\beta)=
\begin{cases}
\begin{split}
\frac{1}{\beta^\alpha \Gamma(\alpha)}x^{\alpha-1}e^{\frac{-x}{\beta}}&, x>0 \\\\
0,\qquad\qquad 그\ 외
\end{split}
\end{cases}$$
감마분포는 0보다 큰 $\alpha, \beta$를 모수로 갖습니다.
감마분포의 평균과 분산은 아래와 같습니다.
$$\mu=\alpha\beta\qquad\sigma^2=\alpha\beta^2$$
이때, $\alpha$가 1일 때의 특수한 경우를 지수분포라고 합니다. 지수분포의 확률밀도함수와 평균, 분산은 아래와 같습니다.
$$f(x;\beta)=
\begin{cases}
\begin{split}
\frac{1}{\beta}e^{\frac{-x}{\beta}}, x>0 \\\\
0,\qquad 그\ 외
\end{split}
\end{cases}$$
$$\mu=\beta\qquad\sigma^2=\beta^2$$
포아송 분포와 지수분포의 관계
여기까지 봤을 때는 이들이 포아송 분포와 무슨 상관이 있을까 싶을겁니다. 지수분포는 감마분포의 특수한 경우고, 특히 포아송 분포와 관련이 깊습니다.
포아송 분포는 일정 시간, 공간에서 특정한 수의 사건이 발생할 확률을 계산하는데 사용되죠, 이때 확률변수는 사건발생 수입니다. 반면에, 지수분포는 사건 발생 수가 아닌 다음 사건이 일어날 때까지의 시간을 확률변수로 갖습니다. 이렇기 때문에 포아송 분포는 이산 확률분포, 지수분포는 연속형 확률분포인거죠!
그러면 포아송 분포를 이용해서 지수분포를 유도해보겠습니다. $x$시간 내에 첫번째 사건이 발생할 확률을 계산해봅니다.
$x$시간 내에 첫번째 사건이 발생할 확률은, 1에서 $x$시간 내에 첫번째 사건이 발생하지 않을 확률을 빼는 것과 같습니다. 이는 $x$시간 동안 단 한번도 사건이 발생하지 않을 확률 $p(0;\lambda x)$과 같습니다.
포아송 분포에 의해
$$P(X>x)=p(0;\lambda x)=e^{-\lambda x},$$
우리가 구하고자 하는 확률은 아래와 같은 $X$의 누적분포함수가 됩니다.
$$P(0\leq X \leq x)=1-e^{-\lambda x}$$
연속형 확률변수의 누적분포함수를 미분하면 확률밀도함수가 되기 때문에, 이를 미분한 결과는 $\lambda=\frac{1}{\beta}$인 지수분포의 확률밀도함수와 같아집니다.
$$f(x)=\lambda e^{-\lambda x}$$
이렇게, 지수분포의 모수 $\beta$는 포아송 분포의 모수인 $\lambda$와 역수 관계임이 확인되었습니다. 그렇다면, 우리는 $\beta$를 평균사건발생간격으로 볼 수 있습니다. 비록 우리가 구한건 최조 사건 발생까지의 시간이지만, 단위시간 당 평균 사건 발생 수($\lambda$)는 시간에 관계없이 동일하기 때문에 이런 해석이 가능합니다.
지수분포와 감마분포의 관계
지수분포는 감마분포의$\alpha$가 1일 때의 특수한 경우고, 평균사건발생간격 $\beta$를 모수로 갖는 사건발생간격의 확률분포입니다.
그렇다면 $\alpha$가 1보다 큰 경우인 감마분포는 무엇을 의미할까요? 감마분포는 평균사건발생간격이 $\beta$인 사건이 $\alpha$번 발생할 때까지의 시간의 확률분포입니다.
마무리
이번에는 포아송 분포와 관련이 깊은 지수분포, 감마분포에 대해서 알아봤습니다.
세 분포를 한 문장씩 정리하면 아래와 같습니다.
포아송 분포: 단위시간, 단위범위 당 사건 발생횟수 $\lambda$가 주어졌을 때, 주어진 시간 동안 포아송 사건이 $x$번 발생할 확률의 분포
지수분포: 평균사건발생간격 $\beta(=\frac{1}{\lambda})$가 주어졌을 때, 시간 $x$내에 포아송 사건이 발생할 확률의 분포
감마분포: 평균사건발생간격 $\beta$가 주어졌을 때, 시간 $x$내에 포아송 사건이 $\alpha$번 발생할 확률의 분포
감마분포에 사용된 감마함수는 카이제곱분포, 베타분포에도 사용됩니다. 특히, 카이제곱분포는 감마분포의 모수인 $\alpha, \beta$가 각각 $v/2, 2$일 때의 특수한 형태로, 통계적 추론에서 많이 쓰입니다.
나중에 기회가 되면 두 분포에 대해서도 정리하겠습니다.
글 읽어주셔서 감사합니다!
References
'[Mathmatics]' 카테고리의 다른 글
[Statistics] MLE (Maximum Likelihood Estimation) (0) | 2021.08.16 |
---|---|
[Statistics] 정규분포 (0) | 2021.04.27 |
[Statistics] 이산형 확률분포 (0) | 2021.04.27 |
[Statistics] 상관관계와 공분산 (0) | 2021.04.27 |
[Statistics] 평균, 분산, 표준편차 (0) | 2021.04.27 |