특징 추출 (Feature Extraction)

특징 추출 (Feature Extraction)

2021, Feb 17    


  • 참조 : 패턴 인식 (오일석)


  • 이번 글에서는 머신 러닝에서 자주 언급되는 용어인 특징 추출 (Feature Extraction)에 대하여 살펴보도록 하겠습니다.
  • 글의 목표는 전통적으로 많이 사용되는 특징 추출 방법들을 통하여 특징 추출의 의미가 무엇인 지 이해하는 것에 있습니다. 머신 러닝에서 사용되는 특징 추출 방법들이 딥러닝이 도입되면서 많이 사용되고 있지는 않습니다. 그럼에도 불구하고 이 글에서 다루는 내용들은 전통적으로 많이 사용하는 방법으로 아직 까지도 그 의미는 유효합니다.


  • 머신 러닝 책들 (Bishop, Theodoridis의 책들)을 살펴보면 특징 (feature)과 관련된 내용은 굉장히 많이 차지합니다. 그와 관련된 자세한 내용들을 모두 살펴보지는 않을 것이며 가볍게 살펴볼 수 있는 중요한 내용들만 다룰 예정입니다.
  • 특히 특징을 선정할 때에는 2가지 기준이 우수해야 좋은 특징을 추출했다고 말할 수 있습니다. 첫 번째가 discriminatory power 즉 분별력입니다. 좋은 특징은 서로 다른 부류를 잘 분별해 주어야 하기 때문입니다. 두번째가 dimensionality 입니다. 특징 벡터의 차원이 낮을수록 즉, 특징의 갯수가 적을수록 계산 효율이 좋고 차원의 저주에서 멀어지기 때문입니다. 이 글에서 다루는 몇가지 방법은 이 기준에서 우수하다고 말할 수 있습니다.


목차


  • 특징 생성

  • 영역에서의 특징 추출

  • 변환을 이용한 특징

  • 시계열 신호에서의 특징 추출

  • 주성분 분석

  • Fisher의 선형 분별

  • 실용적인 사례