베이즈 방법

이번 글에서는 베이즈 방법(베이지안 방법 : Bayesian Methods Of Estimation)에 대하여 알아보도록 하겠습니다.
베이즈 방법을 공부해야 하는 이유가 무엇일까요? 베이즈 방법을 배우는 의미를 먼저 알아보도록 하겠습니다.
베이즈 방법에 등장하는 사후추정은 사전추정이나 표본 자료보다 정확하기 때문입니다. 표본자료와 사전 정보를 같이 고려할 때 각각 하나의 정보만 이용할 경우보다 더 나은 사후정보를 얻습니다.
- 이러한 이유로 베이즈 추정은 반드시 다루어야 하는 통계 이론 중 하나입니다.
전통적인 방법 : 확률표본의 정보만 이용
예를 들어 정규 분포의 경우, 표본 평균 \(\bar{X}\)에 대해, 구간 \(\Bigl( \bar{X} - 1.96\frac{\sigma}{\sqrt{n}}, \bar{X} + 1.96\frac{\sigma}{\sqrt{n}} \Bigr)\)에 실제 평균값 \(\mu\)가 들어있다고 95% 확신

베이즈 방법 : 모수를 확률 변수로 다룸
　\(\theta\) : 모수(값)
　\(\Theta\) : 모수(확률변수)
　\(\pi (\theta)\) (사전분포 : prior distribution) : \(\Theta\)의 확률분포로 \(\theta\)의 값이 어느 정도 되는지를 알고 있는 상황

크기 n인 확률 표본을 \(x = (x_{1}, x_{2}, \cdots , x_{n})\)과 같이 나타내고, 모수 \(\theta\)에 대해 표본의 표본분포를 \(f(x \vert \theta)\)로 나타냅니다.

정의 : 자료 \(x\)가 주어질 경우의 \(\theta\)의 분포(사후 분포 : posterior distribution)은 \(\pi(\theta \vert x) = \frac{f(x \vert \theta)\pi(\theta)}{g(x)}\)로 주어집니다.
- 여기서 \(g(x)\)는 \(x\)의 주변분포 입니다.
주변분포 \(g(x)\) 는 다음을 따릅니다.
- 이산형 : \(\sum_{\theta} f(x \vert \theta)\pi(\theta)\)
- 연속형 : \(\int_{-\infty}^{\infty} f(x \vert \theta) \pi(\theta) d \theta\)

P	0.1	0.2
\(\pi(p)\)	0.6	0.4

이 때, \(x\)를 크기 2인 확률 표본 중 불량품의 수라고 가정하겠습니다. \(x\)가 관측된 후 \(p\)의 사후 분포를 구해 보겠습니다.
확률 분포 \(x\)는 이항 분포를 따릅니다.