
베이즈 방법
2019, Aug 11
- 이번 글에서는 베이즈 방법(베이지안 방법 : Bayesian Methods Of Estimation)에 대하여 알아보도록 하겠습니다.
- 베이즈 방법을 공부해야 하는 이유가 무엇일까요? 베이즈 방법을 배우는 의미를 먼저 알아보도록 하겠습니다.
- 베이즈 방법에 등장하는 사후추정은 사전추정이나 표본 자료보다 정확하기 때문입니다. 표본자료와 사전 정보를 같이 고려할 때 각각 하나의 정보만 이용할 경우보다 더 나은 사후정보를 얻습니다.
- 이러한 이유로 베이즈 추정은 반드시 다루어야 하는 통계 이론 중 하나입니다.
- 전통적인 방법 : 확률표본의 정보만 이용
- 예를 들어 정규 분포의 경우, 표본 평균 ¯X에 대해, 구간 (¯X−1.96σ√n,¯X+1.96σ√n)에 실제 평균값 μ가 들어있다고 95% 확신
- 베이즈 방법 : 모수를 확률 변수로 다룸
- θ : 모수(값)
- Θ : 모수(확률변수)
- π(θ) (사전분포 : prior distribution) : Θ의 확률분포로 θ의 값이 어느 정도 되는지를 알고 있는 상황
- 크기 n인 확률 표본을 x=(x1,x2,⋯,xn)과 같이 나타내고, 모수 θ에 대해 표본의 표본분포를 f(x|θ)로 나타냅니다.
- 베이즈 정리 : P(A|B)=P(B|A)P(A))P(B)
정의
: 자료 x가 주어질 경우의 θ의 분포(사후 분포 : posterior distribution)은 π(θ|x)=f(x|θ)π(θ)g(x)로 주어집니다.- 여기서 g(x)는 x의 주변분포 입니다.
- 주변분포 g(x) 는 다음을 따릅니다.
- 이산형 : ∑θf(x|θ)π(θ)
- 연속형 : ∫∞−∞f(x|θ)π(θ)dθ
- 예제를 한번 살펴보겠습니다.
- 어느 생산 기계의 불량률의 사전 분포가 다음과 같습니다.
P | 0.1 | 0.2 |
---|---|---|
π(p) | 0.6 | 0.4 |
- 이 때, x를 크기 2인 확률 표본 중 불량품의 수라고 가정하겠습니다. x가 관측된 후 p의 사후 분포를 구해 보겠습니다.
- 확률 분포 x는 이항 분포를 따릅니다.