Bias Correction of Exponentially Weighted Averages

Bias Correction of Exponentially Weighted Averages

2019, Jul 17    



  • 앞의 글에서는 지수 가중 평균을 어떻게 구현하는지 대하여 배웠습니다.
  • 이번 글에서는 편향 보정이라고 불리는 기술적인 세부 사항으로 평균을 좀 더 정확하게 계산할 수 있는 방법에 대하여 배워보겠습니다.
Drawing


  • 이전 글에서 다룬바와 같이 β가 0.9일 때는 그래프 상에 빨간색 선과 같은 값을 가지고 β가 0.98일 때에는 그래프 상에 초록샌 선과 같은 값을 가지게 됨을 알 수 있었습니다.
  • 하지만 초기값을 어떻게 두느냐에 따라서 보라색 곡선을 가지게 될 수도 있는데, 보라색 곡선의 경우는 처음 값이 실제 데이터의 값을 따라가지 못하고 있는 문제가 있음을 알 수 있습니다.
  • 예를 들어 보라색 곡선의 경우 초기값 v0을 0으로 두었다고 볼 수 있습니다.
  • 따라서 β=0.98일 때, 초기값은 v0=0이 되고 v1=0.98v0+0.02θ1=0.02θ1이 됩니다.
  • 그리고 v2=0.98v1+0.02θ2=0.0196theta1+0.02θ2가 되는데 이 값 또한 거의 0에 수렴합니다.
  • 이런 초기값을 원래 데이터와 유사하도록 보정해 주는 작업이 필요한데 그 방법이 편향 보정 방법입니다.


  • 위 슬라이드의 오른쪽을 보면 vt 값에 1βt 값을 나누어 줍니다.
  • 예를 들어 t = 2인 경우 1β2=1(0.98)2=0.0396이 되므로 v20.0396=0.0196θ1+0.02θ20.0396이 됩니다.
    • 즉 기존의 값인 v2 보다 좀 더 값이 커진 상태가 됩니다.
  • 그리고 t의 값이 점점 커질수록 βt의 값은 0에 수렴하게 되므로 편향 보정을 적용하여도 vt 와 거의 동일한 값을 가지게 됩니다.
  • 즉, 초기값 부근에서만 값을 보정받을 수 있게 됩니다.

  • 다음 글 : Gradient descent with momentum