베이즈 방법

베이즈 방법

2019, Aug 11    
  • 이번 글에서는 베이즈 방법(베이지안 방법 : Bayesian Methods Of Estimation)에 대하여 알아보도록 하겠습니다.
  • 베이즈 방법을 공부해야 하는 이유가 무엇일까요? 베이즈 방법을 배우는 의미를 먼저 알아보도록 하겠습니다.
  • 베이즈 방법에 등장하는 사후추정은 사전추정이나 표본 자료보다 정확하기 때문입니다. 표본자료와 사전 정보를 같이 고려할 때 각각 하나의 정보만 이용할 경우보다 더 나은 사후정보를 얻습니다.
    • 이러한 이유로 베이즈 추정은 반드시 다루어야 하는 통계 이론 중 하나입니다.
  • 전통적인 방법 : 확률표본의 정보만 이용
  • 예를 들어 정규 분포의 경우, 표본 평균 ¯X에 대해, 구간 (¯X1.96σn,¯X+1.96σn)에 실제 평균값 μ가 들어있다고 95% 확신


  • 베이즈 방법 : 모수를 확률 변수로 다룸
  •  θ : 모수(값)
  •  Θ : 모수(확률변수)
  •  π(θ) (사전분포 : prior distribution) : Θ의 확률분포로 θ의 값이 어느 정도 되는지를 알고 있는 상황


  • 크기 n인 확률 표본을 x=(x1,x2,,xn)과 같이 나타내고, 모수 θ에 대해 표본의 표본분포를 f(x|θ)로 나타냅니다.


  • 베이즈 정리 : P(A|B)=P(B|A)P(A))P(B)


  • 정의 : 자료 x가 주어질 경우의 θ의 분포(사후 분포 : posterior distribution)은 π(θ|x)=f(x|θ)π(θ)g(x)로 주어집니다.
    • 여기서 g(x)x의 주변분포 입니다.
  • 주변분포 g(x) 는 다음을 따릅니다.
    • 이산형 : θf(x|θ)π(θ)
    • 연속형 : f(x|θ)π(θ)dθ


  • 예제를 한번 살펴보겠습니다.
  • 어느 생산 기계의 불량률의 사전 분포가 다음과 같습니다.
P 0.1 0.2
π(p) 0.6 0.4


  • 이 때, x를 크기 2인 확률 표본 중 불량품의 수라고 가정하겠습니다. x가 관측된 후 p의 사후 분포를 구해 보겠습니다.
  • 확률 분포 x는 이항 분포를 따릅니다.