
감마분포와 지수분포 (Gamma distribution and Exponential distribution)
2020, Apr 06
목차
-
감마 함수
-
감마 분포와 지수 분포
-
감마 분포의 평균과 분산
-
지수 분포의 평균과 분산
-
포아송 과정과의 관계
-
확률 분포 정리
- 이번 글에서는 감마 분포와 지수 분포에 대하여 다루어 보려고 합니다.
- 감마 분포는 감마 함수와 연관되어 있어 이름이 감마 분포이고 지수 분포는 물론 지수 함수와 연관되어 있어 지수 분포 이름을 가지게 됩니다. 특히 지수 분포는 감마 분포의 특수한 경우에 해당됩니다.
- 감마 분포는 대표적으로 대기 시간이 얼마나 되는지, 어떤 사건이 발생할 때 까지 얼마나 많은 시간이 필요한 지 등에 사용되어 신뢰도에도 적용할 수 있습니다.
감마 함수
감마 함수
는 α>0α>0 인 αα에 대하여 다음과 같이 정의 됩니다.
- Γ(α)=∫∞0xα−1e−xdxΓ(α)=∫∞0xα−1e−xdx
- 위 감마 함수는 대표적으로 다음 성질이 성립합니다.
- ① α>1α>1일 때, Γ(α)=(α−1)Γ(α−1)Γ(α)=(α−1)Γ(α−1)
- ② Γ(1)=1Γ(1)=1이고 양의 정수 n에 대하여 Γ(n)=(n−1)!Γ(n)=(n−1)!
- ③ Γ(12)=√πΓ(12)=√π
- 두 성질을 보면 감마 함수는 팩토리얼을
실수
범위로 확장한 것으로 해석할 수 있습니다. - 그러면 위 2가지 성질에 대하여 증명을 해보도록 하겠습니다.
- 먼저 ① 식을 증명하기 위하여 부분 적분의 성질을 이용해 보도록 하겠습니다. 다음과 같습니다.
- ∫f′(x)g(x)=f(x)g(x)−∫f(x)g′(x)∫f′(x)g(x)=f(x)g(x)−∫f(x)g′(x)
- 여기서 적분 하기 쉬운 것을 f(x)f(x)로 두겠습니다. f(x)=e−x, g(x)=xα−1
- Γ(α)=−xα−1e−x|∞0+∫∞0(α−1)xα−2e−xdx
- =(α−1)Γ(α−1)
- 다음으로 ② 식을 증명해 보도록 하겠습니다.
- Γ(1)=∫∞0e−xdx=−e−x|∞0=1
- Γ(n)=(n−1)Γ(n−1)=(n−1)(n−2)Γ(n−3)=(n−1)(n−2)...(1)Γ(1)=(n−1)!
- 마지막으로 ③ 식에 대하여 다루어 보겠습니다. 실제로 감마 함수를 사용할 때, Γ(12)=√π를 많이 이용하는데 이 값이 어떻게 도출되는 지 다루어 보겠습니다. 이 값은
치환 적분
과극좌표
를 이용하여 구할 수 있습니다.
- Γ(α)=∫∞0tα−1e−tdt
- Γ(12)=∫∞0t−12e−tdt
- 이 때, x=√t로 치환하면, dx=12t−12dt가 됩니다.
- Γ(12)=2∫∞0e−x2dx
- Γ(12)2=4∫∞0e−x2dx∫∞0e−y2dy
- =4∫∞0(∫∞0e−x2)dx e−y2dy
- =4∫∞0∫∞0e−x2e−y2dx dy
- =4∫∞0∫∞0e−(x2+y2)dx dy
- 위 식에서 사용된 x,y를 극좌표가 사용되는 공간으로 가져와서 변환해 보도록 하겠습니다.

- 위 그림과 같이 x,y는 r,θ 로 변환될 수 있고 범위도 변하게 되어 다음 식과 같아 집니다.
- ∫∫ f(x,y) dx dy=∫∫ f(rcos(θ),rsin(θ)) r dr dθ
- 위 식에서 dx dy 가 r dr dθ 로 변환된 이유는 다음과 같습니다.
- x=rcosθ
- y=rsinθ
- 위 식에서 r,θ를 이용하여 야코비안으로 변수 변환하면 다음과 같이 전개됩니다.
- |∂(x,y)∂(r,θ)|
- =|cosθ−rsinθsinθrcosθ|
- =rcos2θ+rsin2θ=r
- 따라서 나머지 식을 전개하면 다음과 같이 정리됩니다.
- Γ(12)2=4∫π20∫∞0e−r2r dr dθ
- 여기서 ∫∞0e−r2r dr 부분과 θ는 관련이 전혀 없으므로 θ 관련 적분 밖으로 나올 수 있습니다.
- =4∫∞0(∫π201 dθ)e−r2r dr
- =4⋅π2∫∞0re−r2 dr dθ
- 치환 적분을 통해 식을 전개 합니다. u=−r2,du=−2rdr로 치환합니다. 그러면 다음 식과 같이 됩니다.
- =4⋅π2∫∞0re−u −12rdu
- =4⋅π2⋅(−12)∫∞0e−udu
- =4⋅π2⋅(−12)[e−u]∞0
- =π
- 따라서 양변에 루트를 적용하면 최종적으로 다음과 같이 정리 됩니다.
- Γ(12)=√π
감마 분포와 지수 분포
- 앞에서 살펴본 감마 함수를 이용하여 감마 분포에 대하여 알아보도록 하겠습니다. 먼저 감마분포의 정의는 다음과 같습니다.
- 연속 확률 변수 X의 확률 밀도 함수가 아래와 같이 주어질 때, X는 모수 α,β를 가지는 감마 분포를 따릅니다.
- f(x;α,β)={1βαΓ(α)xα−1e−xβ,x>00,else x
- (α>0,β>0)

- 감마 분포의 분포 곡선은 위 그림과 같고 그 모양은 파라미터인 α,β에 따라 달라지게 됩니다.
- 이 때, α는 분포의 모양을 결정하므로
shape parameter
라고 하며 β는 크기를 결정하기 때문에scale parameter
라고 합니다. - 왼쪽 그림에서는 α를 고정한 상태에서 β를 변경하여 가로 세로의 비율이 조정된 형태를 관찰할 수 있습니다.
- 오른쪽 그림에서는 β를 고정한 상태에서 α를 변경하여 그래프의 모양이 변경되는 것을 관찰할 수 있습니다.
- 지수 분포는 감마 분포의
shape parameter
α=1인 특수한 경우로 정의됩니다. - 따라서 감마 분포로 부터 도출된 지수 분포의 정의는 다음과 같습니다.
- f(x;β)={1βe−xβ,x>00else x
- (β>0)
- 위 식에서 지수 분포는 모수 β에 따라 분포가 결정됩니다.
- 감마 분포에 대해서 간략하게 알아보았는데, 감마 함수에서 어떻게 감마 분포가 도출 되는 지 알아보겠습니다. 앞에서 소개한 것과 같이 감마 분포는 감마 함수 식에서 도출되었습니다.
- Γ(α)=∫∞0tα−1e−tdt
- 감마 함수의 양변에 Γ(α)로 나누겠습니다.
- 1=∫∞01Γ(α)tα−1e−tdt
- 양수 β에 대하여 t=xβ 라고 하면 dt=1βdx 가 됩니다.
- 앞에서 전개한 식에 t=xβ과 dt=1βdx를 대입해 보겠습니다.
- 1=∫infty01Γ(α)tα−1e−t dt=∫∞01Γ(α)(xβ)α−1e−xβ1β dx
- =∫∞01βαΓ(α)xα−1e−xβ dx=∫∞0f(x;α,β) dx
감마 분포의 평균과 분산
- 감마 분포의 평균과 분산은 다음과 같습니다.
- μ=αβ
- σ2=αβ2
- 위 결과가 감마 분포와 감마 함수를 통해 어떻게 도출되는 지 알아보도록 하겠습니다.
- 먼저 평균 μ=E(X) 를 알아보도록 하겠습니다.
- μ=E(X)=x⋅f(x;α,β)=1βαΓ(α)∫∞0xαe−xβ dx
- y=xβ substitution : x=βy,dx=βdy
- μ=βΓ(α)∫∞0e−y dy=βΓ(α)Γ(α+1)=αβ
- ∵ Γ(α)=∫∞0tα−1e−t dt,Γ(α)=(α−1)Γ(α−1)
- 다음으로 분산 σ2=E(X2)−E(X)2을 알아보도록 하겠습니다.
- E(X2)=1βαΓ(α)∫∞0xα+1e−xβ dx=β2Γ(α)∫∞0yα+1e−y dy
- β2Γ(α)Γ(α+2)=β2Γ(α)α(α+1)Γ(α)=α(α+1)β2
- σ2=E(X2)−μ2=α2β2+αβ2−α2β2=αβ2
지수 분포의 평균과 분산
- 감마 분포의 평균과 분산을 통해 지수 분포의 평균과 분산을 구해보겠습니다. 지수 분포는 감마 분포에서 α=1인 케이스입니다.
- μ=β
- σ2=β2
포아송 과정과의 관계
- 포아송 분포는 어떤 길이의 시간이나 공간에서 특정한 시간이 발생할 확률을 나타냅니다.
- 주어진 시간간격/영역 동안 평균 μ=λt번 발생할 때, x번 발생할 확률
- p(x,λt)=eλt(λt)xx! (x=0,1,2,...)
- 포아송 분포를 응용하면 t 시간 동안 하나의 사건도 발생하지 않을 확률을 구할 수 있습니다.
- p(0;λt)=eλt(λt)00!=e−λt
- 이번에는 관점을 조금 바꾸어서 확률 변수 x를 첫번째 포아송 사건이 발생하기까지의 소요된 시간으로 보고 f(x)를 x의 확률밀도함수라고 생각하겠습니다.
- 그러면 첫번째 사건이 발생하기까지 걸린 시간이 x보다 클 확률 = x 시간 내 포아송 사건이 1 건도 발생하지 않을 확률이 됩니다.
- P(X>x)=eλx
- 그러면 X의 누적 분포 함수에 대하여 알아보겠습니다.
- P(0≤X≤x)=1−eλx=∫x0f(t) dt
- 위 식에서 t는 누적 분포 함수를 나타내기 위해 도입한 변수입니다. 여기서 f(t)를 구하기 위해서 1−eλx를 미분하면 f(x)=λeλx가 됩니다.
- 이 때, λ=1β이면, 1βe−xβ=f(x;β)로 지수 분포가 됩니다.
- 여기서 핵심은
포아송 분포
에서횟수
를 생각하다가 관점을 바꾸어서시간
에 대하여 생각한 것이지수 분포
와감마 분포
가 되는 것입니다.
확률 분포 정리
포아송 분포
와지수 분포
,감마 분포
의 관계는이산형 확률 분포
에서이항 분포
,음이항 분포
,기하 분포
관계와 유사합니다.베르누이 과정
: 1회 성공 확률이 p인 독립시행을 반복하여 시행이항 분포
: n회 베르누이 시행 중 x번 성공할 확률음이항 분포
: k번째 성공이 일어날 때 까지 x번 시행했을 확률기하 분포
: 첫번째 성공이 일어날 때 까지 x번 시행했을 확률
포아송 과정
: 일정 시간 간격/영역에서 평균 μ번 발생하는 사건의 발생 횟수의 확률은 시간 간격/영역의 크기에 비례포아송 분포
: 어떤 사건이 일정 간격 동안 평균 μ=λt번 발생하였을 때, x번 발생할 확률감마 분포
: 어떤 사건이 일정 간격 동안 발생 횟수의 평균이 1β로 주어질 때, α번 발생했을 시간(대기 시간)에 대한 확률 분포지수 분포
: 어떤 사건이 첫번째 발생하기 까지 걸리는 시간에 대한 확률 분포