BatchNormalization, Dropout, Pooling 적용 순서
2019, Jun 30
- 딥러닝 프레임워크를 이용하여 네트워크를 구성할 때 다양한 정규화 기법들을 사용하곤 합니다.
- 배치 정규화(batch normaliation), 드랍 아웃을 사용할 때, 어떤 순서로 사용가능한 지 알아보겠습니다.
- 출처 : stackoverflow
- 아래 내용은 배치 정규화와 드랍아웃의 저자들의 의견만 정리한 것입니다.
- 먼저 배치 정규화의 경우 저자에 따르면 Convoluter Layer 또는 Fully Connected Layer 등의 layer 뒤에 적용되는 것이 맞다고 봅니다.
- 그리고 ReLU와 같은 Activation function을 적용하기 전에 적용하는 것을 추천하고 있습니다.
- 왜냐하면 배치 정규화의 목적이 네트워크 연산 결과가 원하는 방향의 분포대로 나오는 것이기 때문에 핵심 연산인 Convolution 연산 뒤에 바로 적용하여 정규화 하는 것이 핵심입니다.
- 즉, Activation function이 적용되어 분포가 달라지기 전에 적용하는 것이 올바릅니다.
- 반면 dropout의 경우 저자에 따르면, activation function을 적용한 뒤에 적용하는 것으로 제안되었습니다.
- 마지막으로 Convolution 연산과 함께 사용되는 pooling 연산은 정규화 기법 적용이 끝난 뒤에 적용하는 것을 추천합니다.
- 이것은 제 경험으로 말씀드리는 것으로 정확하지 않을 수 있지만, dropout 이후에 적용하니 성능이 잘 나왔었습니다.(물론 task 마다 다르겠지요?)
- 정리하면
Convolution - Batch Normalization - Activation - Dropout - Pooling
순서로 네트워크를 구성하면 됩니다. - 아래 그림은 CS231n의 Batchn Normalization 관련 강의 자료 중 일부입니다.