이변량 정규 분포 (1)

이변량 정규 분포 (1)

2019, Feb 07    
  • 출처 :
    • Probability & Statistics for Engineers & Scientists. 9th Edition.(Walpole 저. PEARSON)
    • 수리통계학 (김수택 저. 자유 아카데미)
  • 통계학 관련 글 목록

  • 이번 글과 다음글에서는 이변량 정규 분포에 대하여 자세하게 알아보도록 하겠습니다.



조건부 평균과 조건부 분산

  • X, Y의 결합 밀도함수가 f(x,y)f(x,y)이고, 각각의 주변분포 함수를 fx(x),fy(y)fx(x),fy(y) 라고 합니다.
    • 이산형에서 주변 분포를 구할 때, 어떤 x를 기준으로 y를 모두 더하면 x에 대한 주변 분포를 구할 수 있습니다.
    • 이산형에서 주변 분포를 구할 때, 어떤 y를 기준으로 x를 모두 더하면 y에 대한 주변 분포를 구할 수 있습니다.
    • 연속형에서는 주변 분포를 구할 때, 어떤 x를 기준으로 y에 대하여 적분하면 x에 대한 주변 분포를 구할 수 있습니다.
    • 연속형에서는 주변 분포를 구할 때, 어떤 y를 기준으로 x에 대하여 적분하면 y에 대한 주변 분포를 구할 수 있습니다.


  • 조건부 확률 밀도 함수
    • X = x로 주어질 때, Y에 대한 조건부 확률밀도 함수 : fY|X(y|x)=f(x,y)fX(x)fY|X(y|x)=f(x,y)fX(x)
      • 즉, x가 고정일 때 Y의 분포
    • Y = y로 주어질 때, X에 대한 조건부 확률밀도 함수 : fX|Y(x|y)=f(x,y)fY(y)fX|Y(x|y)=f(x,y)fY(y)
      • 즉, y가 고정일 때 X의 분포


  • 조건부 평균
    • X = x 일 때, Y의 조건부 평균 (조건부 기댓값)
      • ·μY|X=E(Y|x)μY|X=E(Y|x)
        • 이산형 : yyf(y|x)yyf(y|x)
        • 연속형 : yf(y|x)dyyf(y|x)dy
    • Y = y 일 때, X의 조건부 평균 또한 위의 방식과 똑같이 적용할 수 있습니다.
    • 구하려는 분포의 식이 x와 y의 합성 함수라고 하여도 x 또는 y가 고정되어 있으므로 같은 방식으로 적용할 수 있습니다.
    • 즉, X = x 일 때, u(x, Y)의 조건부 평균 :
      • ·E(u(X,Y)|x)E(u(X,Y)|x)
        • 이산형 : yu(x,y)f(y|x)yu(x,y)f(y|x)
        • 연속형 : u(x,y)f(y|x)dyu(x,y)f(y|x)dy
    • 조건부 평균의 핵심은 특정 변수가 고정된 상태에서의 평균이라고 생각하면 됩니다.


  • 조건부 분산
    • ·σ2Y|x=E((YE(Y|x))2|x)=E(Y2|x)E(Y|x)2σ2Y|x=E((YE(Y|x))2|x)=E(Y2|x)E(Y|x)2
      • 조건부 분산의 핵심 또한 특정 변수가 고정된 상태 에서의 분산이라고 생각하면 됩니다.


  • 조건부 기대값의 성질
    • ·E(aX+bY+c|Z=z)=aE(x|z)+bE(Y|z)+cE(aX+bY+c|Z=z)=aE(x|z)+bE(Y|z)+c
    • ·E(E(Y|X))=E(Y)E(E(Y|X))=E(Y)
      • X = x로 고정된 상태에서 Y에 대한 평균을 구하는 것
      • 즉, X=x1,x2,...X=x1,x2,... 에서 여러가지 xixi 로 변경해 가면서 평균을 구하였을 때, 결국에는 E(Y)E(Y) 와 같아집니다.
      • 아래 증명을 참조 하시기 바랍니다.
    • ·E(E(u(X,Y)|X))=E(u(X,Y))E(E(u(X,Y)|X))=E(u(X,Y))
      • 아래 증명을 참조 하시기 바랍니다.
    • ·E(g(x)Y|X=x)=g(x)E(Y|x)E(g(x)Y|X=x)=g(x)E(Y|x)
      • X = x로 고정되어 있기 때문에 g(x) 즉 소문자 x가 대입된 값이 곱 형태로 빠져나올 수 있습니다.
    • ·σ2Y=Var(Y)=E(Var(Y|X))+Var(E(Y|X))σ2Y=Var(Y)=E(Var(Y|X))+Var(E(Y|X))
      • 분산은 조건부 분산의 평균과 조건의 평균의 분산의 합으로 표현 가능합니다.
      • 아래 증명을 참조 하시기 바랍니다.


  • ·E(E(Y|X))=E(Y)E(E(Y|X))=E(Y) 증명
  • ·E(E(Y|X))E(E(Y|X))
    • ·=(yf(y|x)dy)fxxdx=(yf(y|x)dy)fxxdx
      • 이중 적분으로 식을 정리해 보겠습니다.
    • ·=yf(y|x)fxxdydx=yf(y|x)fxxdydx
      • ·f(x,y)=f(y|x)f(x)f(x,y)=f(y|x)f(x) 를 이용하여 식을 정리하면
    • ·=yf(x,y)dxdy=yf(x,y)dxdy
      • 먼저 x에 대하여 적분할 수 있도록 식을 변경합니다.
    • ·=y(f(x,y)dx)dy=y(f(x,y)dx)dy
      • x에 대하여 적분을 하면 Y 확률 변수에 대한 주변 확률 분포를 구할 수 있습니다.
    • ·=yfY(y)dy=yfY(y)dy
      • y의 평균 식으로 변경이 됩니다.
    • ·=E(Y)=E(Y)


  • ·E(E(u(X,Y)|X))=E(u(X,Y))E(E(u(X,Y)|X))=E(u(X,Y)) 증명
  • ·E(E(u(X,Y)|X))E(E(u(X,Y)|X))
    • ·=(u(x,y)f(y|x)dy)fx(x)dx=(u(x,y)f(y|x)dy)fx(x)dx
      • 이중 적분으로 식을 정리해 보겠습니다.
    • ·=u(x,y)f(y|x)fx(x)dydx=u(x,y)f(y|x)fx(x)dydx
      • 조건부 분포와 확률의 곱은 결합 확률 분포로 나타낼 수 있습니다.
    • ·=u(x,y)f(x,y)dydx=u(x,y)f(x,y)dydx
    • ·=E(u(X,Y))=E(u(X,Y))


  • ·σ2Y=Var(Y)=E(Var(Y|X))+Var(E(Y|X))σ2Y=Var(Y)=E(Var(Y|X))+Var(E(Y|X)) 증명
  • ·E(Var(Y|X))E(Var(Y|X))
  • ·=E(E(Y2|X)E(Y|X)2)=E(E(Y2|X)E(Y|X)2)
    • ·E(E(Y2|X)=E(Y2)E(E(Y2|X)=E(Y2) 이므로
  • ·=E(Y2)E(Y)2+E(Y)2E(Y|X)2)=E(Y2)E(Y)2+E(Y)2E(Y|X)2)
    • 식의 전개를 위하여 E(Y)2+E(Y)2E(Y)2+E(Y)2 을 추가하였습니다.
    • ·Var(Y)=E(Y2)E(Y)2Var(Y)=E(Y2)E(Y)2 식을 다음 전개에 이용하겠습니다.
    • ·E(E(Y|X))=E(Y)E(E(Y|X))=E(Y) 식을 다음 전개에 이용하겠습니다.
  • ·=Var(Y)+E(E(Y|X))2E(E(Y|X)2)=Var(Y)+E(E(Y|X))2E(E(Y|X)2)
  • ·=Var(Y)Var(E(Y|X))=Var(Y)Var(E(Y|X))
  • 식을 최종적으로 정리하면 Var(Y)=E(Var(Y|X))+Var(E(Y|X))Var(Y)=E(Var(Y|X))+Var(E(Y|X)) 가 됩니다.


  • 공분산
    • ·Cov(X,Y)=σXY=E((XμX)(YμY))Cov(X,Y)=σXY=E((XμX)(YμY))
      • 이산형 : xy(xμx)(yμy)f(x,y)xy(xμx)(yμy)f(x,y)
      • 연속형 : y((xμx)(yμy)f(x,y)dxdyy((xμx)(yμy)f(x,y)dxdy
    • ·σXY=E(XY)μXμYσXY=E(XY)μXμY
  • 상관계수
    • ·ρXY=σXYσXσY=Cov(X,Y))Var(X)Var(Y)ρXY=σXYσXσY=Cov(X,Y))Var(X)Var(Y)
  • 공분산과 상관계수를 이용하여 조건부 평균에 이용해 보겠습니다.


  • X = x일 때, Y의 조건부 평균이 x에 대해 선형인 경우 (즉, E(Y|x)=a+bxE(Y|x)=a+bx)
  • 이산형의 경우 a+bx=E(Y|x)=yyf(y|x)=yyf(x,y)fX(x)a+bx=E(Y|x)=yyf(y|x)=yyf(x,y)fX(x)
    • ·yyf(x,y)=(a+bx)fX(x)yyf(x,y)=(a+bx)fX(x)
      • 양변에 summation x를 추가해 줍니다.
    • ·xyyf(x,y)=x(a+bx)fX(x)xyyf(x,y)=x(a+bx)fX(x)
      • 좌변은 E(Y)E(Y)로 우변은 E(a+bx)E(a+bx)로 정리 됩니다.
    • ·E(Y)=E(a+bX)E(Y)=E(a+bX)
    • ·μY=a+bμXμY=a+bμX : 1번식
    • 또한 xyyf(x,y)=x(a+bx)fx(x)xyyf(x,y)=x(a+bx)fx(x) 의 식 양변에 x를 곱하여 다음과 같이 변형합니다.
    • ·xyxyf(x,y)=x(ax+bx2)fX(x)xyxyf(x,y)=x(ax+bx2)fX(x)
    • ·E(XY)=E(aX+bX2)=aE(X)+bE(X2)
    • 공분산의 다음 성질을 참조하면
      • ·E(XY)=σXY+μXμY
      • ·σXY=ρXYσXσY
      • ·E(X2)μ2X=σ2X
    • ·E(XY)=σXY+μXμY=μXμY+ρXYσXσY 로 전개할 수 있습니다.
    • ·E(Y)=E(a+bx) 이므로 E(XY)=E(aX+bX2) 으로 표현할 수 있습니다.
    • 따라서 식을 최종적으로 정리하면 μXμY+ρXYσXσY=aμX+b(μ2X+σ2X) : 2번식
    • 1번식2번식을 이용해 보겠습니다.
      • 1번식 : $$ \mu_{Y} = a + b\mu_{X}
      • 2번식 : μXμY+ρXYσXσY=aμX+b(μ2X+σ2X)
      • 연립 방적식을 풀면 해는 다음과 같습니다.
        • ·a=μyρσYσXμX
        • ·b=ρσYσX
      • 따라서 E(Y|x)=μY+ρσYσX(xμX)