본문 바로가기

AI

객체 검출(Object Detection)이란?

Object Detection (객체 탐지)

이미지 데이터에서 물체를 분류하는 Classificaiton 문제와 그 물제가 어디에 있는지 박스(Bounding Box)를 통해 위치를 알아내는 Localization 문제를 함께 해결하는 분야입니다.

 

아래 그림처럼, 이미지에 탐지해야할 객체가 많을 것이므로, 다음과 같이 정리 가능합니다.

Object Detection = Multi-Labeled Classification  + Localization 
즉, 다양한 Class를 분류와 탐지한 객체를 표시하는것 까지가 Object Detection 범위라고 할수 있습니다.

 

 

DeepLearning을 통한 객체 탐지 방법은 1-stage Detector / 2-stage Detector 방법이 있습니다.

  • 1-stage Detector : Classification + Localization을 동시에 수행하여, 빠르지만 정확도가 떨어집니다.
  • 2-stage Detector : Classification + Localization을 순차적으로 수행하는데, 느리지만 정확도가  높습니다.

 

 

Bounding Box ( 바운딩 박스 )

좌상/우하 형태로 나타내거나, 객체 가운데 Center X,Y 와 Width, Heigh 중 한 가지 형태로 나타낸다.

경우에 따라 이미지전체를 사이즈를 0~1로 정의해서 소숫점 값으로 나타내기도 합니다.

  • corner coordinates : 좌상,우하 형태의 양쪽 끝점을 표기 ( min x, min y, max x , max y)
  • center coordinates : 가운데 점, 폭, 높이로 표기 ( center x, center y, width, height )

 

IoU (Intersection over Union) 

Localization 성는 지표로 많이 사용되는 개념으로, 교집합을 합집합으로 나눈 값으로

실제 정답지의 Box (A) 와 객체 검출로 찾은 Box (B)의 차이를 계산한 값을 나타냅니다.

  • 정답면적과 찾은면적의 교집합 = Area of Intersaction
  • 정답면적과 찾은면적의 합집합 = Area of Union