Loading [MathJax]/jax/output/CommonHTML/jax.js
베타 분포

베타 분포

2019, Feb 06    
  • 출처 :
    • Probability & Statistics for Engineers & Scientists. 9th Edition.(Walpole 저. PEARSON)
    • 수리통계학 (김수택 저. 자유 아카데미)
  • 통계학 관련 글 목록


베타 함수의 정의

  • 베타 함수는 α,β>0 일 때, B(α,β)=10xα1(1x)β1dx 로 정의 됩니다.


베타 함수의 성질

  • ·α,β>0 범위에서
  • ·B(α,β)=B(β,α)
    • 베타 함수에서 α,β는 서로 자리를 바꾸어도 치환을 하여 적분식을 풀면 결과는 같습니다.
  • ·B(α,β)=Γ(α)Γ(β)Γ(α+β)
    • ·Γ(α)=0essα1ds 정의를 따르면,
    • ·Γ(α)Γ(β)=0essα1ds0ettβ1dt
    • ·=00e(s+t)sα1tβ1dsdt
    • 변수변환으로 s=xy,t=x(1y) 라고 하면 치환 적분처럼 생각할 수 있습니다.
      • 치환 적분을 하면 변수의 영역이 s,t 에서 x,y 로 변환됩니다.
        • 이 때, 자코비안의 절대값을 곱해주어야 합니다. (다중적분의 변수변환 참조)
      • s, t에 대한 x, y의 자코비안을 구해보겠습니다.
      • ·J=(s,t)(x,y)=|sxsytxty|=|yx1yx|=xyx+xy=x
        • 마지막으로 절대값을 취해주면 |x|=x입니다.
    • ·s=xy,t=x(1y) 에서 적분의 범위를 살펴보면 s와 t의 범위가 0 ~ 무한대이므로
      • x의 범위는 0 ~ 무한대 입니다.
      • y = 1인 경우 t = 0, s는 무한대의 범위를 가질 수 있습니다.
      • y = 0인 경우 s = 0, t는 무한대의 범위를 가질 수 있습니다.
      • 즉, y = 0 과 1의 값을 경계로 s와 t가 0 ~ 무한대 범위를 가집니다.
      • 따라서, y의 범위는 0 ~ 1, x의 범위는 0 ~ 무한대 입니다.
    • ·Γ(α)Γ(β)=010ex(xy)α1(x(1y))β1x dydx
    • ·=0exxα+β1dx10yα1(1y)β1
    • ·=Γ(α+β)B(α,β)


베타 분포

  • 확률밀도함수가 f(x;α,β)=1B(α,β)xα1(1x)β1
    • 이 때, 0<x<1 이고 α,β>0 일 때,
    • 모수가 α,β베타분포라고 합니다.
    • 이 때, 1B(α,β)면적을 1로 만들기 위한 정규화 입니다.
    • 형태가 이항 분포와 비슷합니다. 이항 분포는 이산 확률 변수에 관한 확률이고 이항 분포에 대응하는 연속 확률 변수의 확률이 베타 분포입니다.
      • 예를 들어, 전체 시간 중에 x를 하는 시간 또는 전체 물질의 양 중에 x의 비율 등이 있습니다.
  • Drawing
    • 그래프의 x축을 보면 0<x<1 구간에서의 분포입니다.
    • ·α=β=1 이면, f(x;α,β)=
      • 0<x<1 : 1
      • 그 이외의 x : 0
      • 균일 분포(uniform distribution)을 가집니다.
    • ·α=β인 경우 x=12 중심으로 좌우대칭 입니다.
    • ·α<β 이면 왼쪽으로, α>β 이면 오른쪽으로 치우칩니다.
    • ·c<X<d인 구간에서의 베타분포 : x=xcdc로 변환하면 0<x<1 입니다.
      • 범위를 0 ~ 1까지 맞춰주기 위해서 변환해 줍니다.


베타 분포의 예제

  • 석유 도매상에서 매주 석유를 공급 받는데, 일주일 동안 공급량에 대한 판매량의 비율을 관찰한 결과 근사적으로 α=2,β=2인 베타분포를 따르고 있었다.
  • 도매상에서 어느 한주일 동안 공급량의 90% 이상을 판매하게 될 확률을 구하여라.
    • 한주일 동안 판매량 비율을 X라고 하면, 확률밀도함수는
    • ·f(x)=1B(4,2)x3(1x)1=Γ(6)Γ(4)Γ(2)(x3x4)=5!3!1!(x3x4)=20(x3x4)(0<x<1)
    • ·P(X>0.9)=10.9f(x)dx=10.920(x3x4)dx=[5x44x5]10.90.08


베타분포와 이항분포의 관계

  • ·α,β가 양의 정수이고 n=α+β1 일 때, 확률 변수 X는 모수 α,β인 베타분포를 따르고
  • 확률 변수 Y는 성공률 p의 n회 시행인 이항분포를 따르면 다음이 성립 합니다.

[P(X \le p) = P(Y \ge \alpha)]

  • 증명은 다소 복잡하여 생략하겠으나 중요한 점은 이산형 베타분포는 이항분포와 연관이 있음을 기억해야 합니다.