감마분포와 지수분포 (Gamma distribution and Exponential distribution)

감마분포와 지수분포 (Gamma distribution and Exponential distribution)

2020, Apr 06    



목차


  • 감마 함수

  • 감마 분포와 지수 분포

  • 감마 분포의 평균과 분산

  • 지수 분포의 평균과 분산

  • 포아송 과정과의 관계

  • 확률 분포 정리


  • 이번 글에서는 감마 분포와 지수 분포에 대하여 다루어 보려고 합니다.
  • 감마 분포는 감마 함수와 연관되어 있어 이름이 감마 분포이고 지수 분포는 물론 지수 함수와 연관되어 있어 지수 분포 이름을 가지게 됩니다. 특히 지수 분포는 감마 분포의 특수한 경우에 해당됩니다.
  • 감마 분포는 대표적으로 대기 시간이 얼마나 되는지, 어떤 사건이 발생할 때 까지 얼마나 많은 시간이 필요한 지 등에 사용되어 신뢰도에도 적용할 수 있습니다.


감마 함수


  • 감마 함수α>0α>0αα에 대하여 다음과 같이 정의 됩니다.


  • Γ(α)=0xα1exdxΓ(α)=0xα1exdx


  • 위 감마 함수는 대표적으로 다음 성질이 성립합니다.
  • α>1α>1일 때, Γ(α)=(α1)Γ(α1)Γ(α)=(α1)Γ(α1)
  • Γ(1)=1Γ(1)=1이고 양의 정수 n에 대하여 Γ(n)=(n1)!Γ(n)=(n1)!
  • Γ(12)=πΓ(12)=π


  • 두 성질을 보면 감마 함수는 팩토리얼을 실수 범위로 확장한 것으로 해석할 수 있습니다.
  • 그러면 위 2가지 성질에 대하여 증명을 해보도록 하겠습니다.


  • 먼저 ① 식을 증명하기 위하여 부분 적분의 성질을 이용해 보도록 하겠습니다. 다음과 같습니다.


  • f(x)g(x)=f(x)g(x)f(x)g(x)f(x)g(x)=f(x)g(x)f(x)g(x)


  • 여기서 적분 하기 쉬운 것을 f(x)f(x)로 두겠습니다. f(x)=ex, g(x)=xα1


  • Γ(α)=xα1ex|0+0(α1)xα2exdx
  • =(α1)Γ(α1)


  • 다음으로 ② 식을 증명해 보도록 하겠습니다.


  • Γ(1)=0exdx=ex|0=1


  • Γ(n)=(n1)Γ(n1)=(n1)(n2)Γ(n3)=(n1)(n2)...(1)Γ(1)=(n1)!


  • 마지막으로 ③ 식에 대하여 다루어 보겠습니다. 실제로 감마 함수를 사용할 때, Γ(12)=π를 많이 이용하는데 이 값이 어떻게 도출되는 지 다루어 보겠습니다. 이 값은 치환 적분극좌표를 이용하여 구할 수 있습니다.


  • Γ(α)=0tα1etdt
  • Γ(12)=0t12etdt


  • 이 때, x=t로 치환하면, dx=12t12dt가 됩니다.


  • Γ(12)=20ex2dx
  • Γ(12)2=40ex2dx0ey2dy
  • =40(0ex2)dx ey2dy
  • =400ex2ey2dx dy
  • =400e(x2+y2)dx dy


  • 위 식에서 사용된 x,y를 극좌표가 사용되는 공간으로 가져와서 변환해 보도록 하겠습니다.


Drawing


  • 위 그림과 같이 x,yr,θ 로 변환될 수 있고 범위도 변하게 되어 다음 식과 같아 집니다.


  •  f(x,y) dx dy= f(rcos(θ),rsin(θ)) r dr dθ


  • 위 식에서 dx dyr dr dθ 로 변환된 이유는 다음과 같습니다.


  • x=rcosθ
  • y=rsinθ


  • 위 식에서 r,θ를 이용하여 야코비안으로 변수 변환하면 다음과 같이 전개됩니다.


  • |(x,y)(r,θ)|
  • =|cosθrsinθsinθrcosθ|
  • =rcos2θ+rsin2θ=r
  • 따라서 나머지 식을 전개하면 다음과 같이 정리됩니다.


  • Γ(12)2=4π200er2r dr dθ


  • 여기서 0er2r dr 부분과 θ는 관련이 전혀 없으므로 θ 관련 적분 밖으로 나올 수 있습니다.


  • =40(π201 dθ)er2r dr
  • =4π20rer2 dr dθ


  • 치환 적분을 통해 식을 전개 합니다. u=r2,du=2rdr로 치환합니다. 그러면 다음 식과 같이 됩니다.


  • =4π20reu 12rdu
  • =4π2(12)0eudu
  • =4π2(12)[eu]0
  • =π


  • 따라서 양변에 루트를 적용하면 최종적으로 다음과 같이 정리 됩니다.


  • Γ(12)=π



감마 분포와 지수 분포


  • 앞에서 살펴본 감마 함수를 이용하여 감마 분포에 대하여 알아보도록 하겠습니다. 먼저 감마분포의 정의는 다음과 같습니다.
  • 연속 확률 변수 X의 확률 밀도 함수가 아래와 같이 주어질 때, X는 모수 α,β를 가지는 감마 분포를 따릅니다.


  • f(x;α,β)={1βαΓ(α)xα1exβ,x>00,else x
  • (α>0,β>0)



Drawing


  • 감마 분포의 분포 곡선은 위 그림과 같고 그 모양은 파라미터인 α,β에 따라 달라지게 됩니다.
  • 이 때, α는 분포의 모양을 결정하므로 shape parameter 라고 하며 β는 크기를 결정하기 때문에 scale parameter 라고 합니다.
  • 왼쪽 그림에서는 α를 고정한 상태에서 β를 변경하여 가로 세로의 비율이 조정된 형태를 관찰할 수 있습니다.
  • 오른쪽 그림에서는 β를 고정한 상태에서 α를 변경하여 그래프의 모양이 변경되는 것을 관찰할 수 있습니다.


  • 지수 분포는 감마 분포의 shape parameter α=1인 특수한 경우로 정의됩니다.
  • 따라서 감마 분포로 부터 도출된 지수 분포의 정의는 다음과 같습니다.


  • f(x;β)={1βexβ,x>00else x
  • (β>0)


  • 위 식에서 지수 분포는 모수 β에 따라 분포가 결정됩니다.


  • 감마 분포에 대해서 간략하게 알아보았는데, 감마 함수에서 어떻게 감마 분포가 도출 되는 지 알아보겠습니다. 앞에서 소개한 것과 같이 감마 분포는 감마 함수 식에서 도출되었습니다.


  • Γ(α)=0tα1etdt


  • 감마 함수의 양변에 Γ(α)로 나누겠습니다.


  • 1=01Γ(α)tα1etdt


  • 양수 β에 대하여 t=xβ 라고 하면 dt=1βdx 가 됩니다.
  • 앞에서 전개한 식에 t=xβdt=1βdx를 대입해 보겠습니다.


  • 1=infty01Γ(α)tα1et dt=01Γ(α)(xβ)α1exβ1β dx
  • =01βαΓ(α)xα1exβ dx=0f(x;α,β) dx


감마 분포의 평균과 분산


  • 감마 분포의 평균과 분산은 다음과 같습니다.


  • μ=αβ
  • σ2=αβ2


  • 위 결과가 감마 분포와 감마 함수를 통해 어떻게 도출되는 지 알아보도록 하겠습니다.
  • 먼저 평균 μ=E(X) 를 알아보도록 하겠습니다.


  • μ=E(X)=xf(x;α,β)=1βαΓ(α)0xαexβ dx
  • y=xβ    substitution :   x=βy,dx=βdy
  • μ=βΓ(α)0ey dy=βΓ(α)Γ(α+1)=αβ
  •  Γ(α)=0tα1et dt,Γ(α)=(α1)Γ(α1)


  • 다음으로 분산 σ2=E(X2)E(X)2을 알아보도록 하겠습니다.


  • E(X2)=1βαΓ(α)0xα+1exβ dx=β2Γ(α)0yα+1ey dy
  • β2Γ(α)Γ(α+2)=β2Γ(α)α(α+1)Γ(α)=α(α+1)β2
  • σ2=E(X2)μ2=α2β2+αβ2α2β2=αβ2


지수 분포의 평균과 분산


  • 감마 분포의 평균과 분산을 통해 지수 분포의 평균과 분산을 구해보겠습니다. 지수 분포는 감마 분포에서 α=1인 케이스입니다.


  • μ=β
  • σ2=β2


포아송 과정과의 관계


  • 포아송 분포는 어떤 길이의 시간이나 공간에서 특정한 시간이 발생할 확률을 나타냅니다.
    • 주어진 시간간격/영역 동안 평균 μ=λt번 발생할 때, x번 발생할 확률


  • p(x,λt)=eλt(λt)xx!    (x=0,1,2,...)


  • 포아송 분포를 응용하면 t 시간 동안 하나의 사건도 발생하지 않을 확률을 구할 수 있습니다.


  • p(0;λt)=eλt(λt)00!=eλt


  • 이번에는 관점을 조금 바꾸어서 확률 변수 x첫번째 포아송 사건이 발생하기까지의 소요된 시간으로 보고 f(x)x의 확률밀도함수라고 생각하겠습니다.
  • 그러면 첫번째 사건이 발생하기까지 걸린 시간x보다 클 확률 = x 시간 내 포아송 사건이 1 건도 발생하지 않을 확률이 됩니다.


  • P(X>x)=eλx


  • 그러면 X의 누적 분포 함수에 대하여 알아보겠습니다.


  • P(0Xx)=1eλx=x0f(t) dt


  • 위 식에서 t는 누적 분포 함수를 나타내기 위해 도입한 변수입니다. 여기서 f(t)를 구하기 위해서 1eλx를 미분하면 f(x)=λeλx가 됩니다.


  • 이 때, λ=1β이면, 1βexβ=f(x;β)로 지수 분포가 됩니다.
  • 여기서 핵심은 포아송 분포에서 횟수를 생각하다가 관점을 바꾸어서 시간에 대하여 생각한 것이 지수 분포감마 분포가 되는 것입니다.


확률 분포 정리


  • 포아송 분포지수 분포, 감마 분포의 관계는 이산형 확률 분포에서 이항 분포, 음이항 분포, 기하 분포 관계와 유사합니다.
  • 베르누이 과정 : 1회 성공 확률이 p인 독립시행을 반복하여 시행
  • 이항 분포 : n회 베르누이 시행 중 x번 성공할 확률
  • 음이항 분포 : k번째 성공이 일어날 때 까지 x번 시행했을 확률
  • 기하 분포 : 첫번째 성공이 일어날 때 까지 x번 시행했을 확률


  • 포아송 과정 : 일정 시간 간격/영역에서 평균 μ번 발생하는 사건의 발생 횟수의 확률은 시간 간격/영역의 크기에 비례
  • 포아송 분포 : 어떤 사건이 일정 간격 동안 평균 μ=λt번 발생하였을 때, x번 발생할 확률
  • 감마 분포 : 어떤 사건이 일정 간격 동안 발생 횟수의 평균1β로 주어질 때, α번 발생했을 시간(대기 시간)에 대한 확률 분포
  • 지수 분포 : 어떤 사건이 첫번째 발생하기 까지 걸리는 시간에 대한 확률 분포