
베타 분포
2019, Feb 06
- 출처 :
- Probability & Statistics for Engineers & Scientists. 9th Edition.(Walpole 저. PEARSON)
- 수리통계학 (김수택 저. 자유 아카데미)
- 통계학 관련 글 목록
베타 함수의 정의
- 베타 함수는 α,β>0 일 때, B(α,β)=∫10xα−1(1−x)β−1dx 로 정의 됩니다.
베타 함수의 성질
- ·α,β>0 범위에서
- ·B(α,β)=B(β,α)
- 베타 함수에서 α,β는 서로 자리를 바꾸어도 치환을 하여 적분식을 풀면 결과는 같습니다.
- ·B(α,β)=Γ(α)Γ(β)Γ(α+β)
- ·Γ(α)=∫∞0e−ssα−1ds 정의를 따르면,
- ·Γ(α)Γ(β)=∫∞0e−ssα−1ds∫∞0e−ttβ−1dt
- ·=∫∞0∫∞0e−(s+t)sα−1tβ−1dsdt
- 변수변환으로 s=xy,t=x(1−y) 라고 하면 치환 적분처럼 생각할 수 있습니다.
- 치환 적분을 하면 변수의 영역이 s,t 에서 x,y 로 변환됩니다.
- 이 때, 자코비안의 절대값을 곱해주어야 합니다. (다중적분의 변수변환 참조)
- s, t에 대한 x, y의 자코비안을 구해보겠습니다.
- ·J=∂(s,t)∂(x,y)=|∂s∂x∂s∂y∂t∂x∂t∂y|=|yx1−yx|=−xy−x+xy=−x
- 마지막으로 절대값을 취해주면 |−x|=x입니다.
- 치환 적분을 하면 변수의 영역이 s,t 에서 x,y 로 변환됩니다.
- ·s=xy,t=x(1−y) 에서 적분의 범위를 살펴보면 s와 t의 범위가 0 ~ 무한대이므로
- x의 범위는 0 ~ 무한대 입니다.
- y = 1인 경우 t = 0, s는 무한대의 범위를 가질 수 있습니다.
- y = 0인 경우 s = 0, t는 무한대의 범위를 가질 수 있습니다.
- 즉, y = 0 과 1의 값을 경계로 s와 t가 0 ~ 무한대 범위를 가집니다.
- 따라서, y의 범위는 0 ~ 1, x의 범위는 0 ~ 무한대 입니다.
- ·Γ(α)Γ(β)=∫∞0∫10e−x(xy)α−1(x(1−y))β−1x dydx
- ·=∫∞0e−xxα+β−1dx∫10yα−1(1−y)β−1
- ·=Γ(α+β)B(α,β)
베타 분포
- 확률밀도함수가 f(x;α,β)=1B(α,β)xα−1(1−x)β−1
- 이 때, 0<x<1 이고 α,β>0 일 때,
- 모수가 α,β 인
베타분포
라고 합니다. - 이 때, 1B(α,β)는 면적을 1로 만들기 위한 정규화 입니다.
- 형태가 이항 분포와 비슷합니다. 이항 분포는 이산 확률 변수에 관한 확률이고 이항 분포에 대응하는 연속 확률 변수의 확률이
베타 분포
입니다.- 예를 들어, 전체 시간 중에 x를 하는 시간 또는 전체 물질의 양 중에 x의 비율 등이 있습니다.
- 그래프의 x축을 보면 0<x<1 구간에서의 분포입니다.
- ·α=β=1 이면, f(x;α,β)=
- 0<x<1 : 1
- 그 이외의 x : 0
- 균일 분포(uniform distribution)을 가집니다.
- ·α=β인 경우 x=12 중심으로 좌우대칭 입니다.
- ·α<β 이면 왼쪽으로, α>β 이면 오른쪽으로 치우칩니다.
- ·c<X<d인 구간에서의 베타분포 : x∗=x−cd−c로 변환하면 0<x∗<1 입니다.
- 범위를 0 ~ 1까지 맞춰주기 위해서 변환해 줍니다.
베타 분포의 예제
- 석유 도매상에서 매주 석유를 공급 받는데, 일주일 동안 공급량에 대한 판매량의 비율을 관찰한 결과 근사적으로 α=2,β=2인 베타분포를 따르고 있었다.
- 도매상에서 어느 한주일 동안 공급량의 90% 이상을 판매하게 될 확률을 구하여라.
- 한주일 동안 판매량 비율을 X라고 하면, 확률밀도함수는
- ·f(x)=1B(4,2)x3(1−x)1=Γ(6)Γ(4)Γ(2)(x3−x4)=5!3!1!(x3−x4)=20(x3−x4)(0<x<1)
- ·P(X>0.9)=∫10.9f(x)dx=∫10.920(x3−x4)dx=[5x4−4x5]10.9≈0.08
베타분포와 이항분포의 관계
- ·α,β가 양의 정수이고 n=α+β−1 일 때, 확률 변수 X는 모수 α,β인 베타분포를 따르고
- 확률 변수 Y는 성공률 p의 n회 시행인 이항분포를 따르면 다음이 성립 합니다.
[P(X \le p) = P(Y \ge \alpha)]
- 증명은 다소 복잡하여 생략하겠으나 중요한 점은 이산형 베타분포는 이항분포와 연관이 있음을 기억해야 합니다.