Object Detection 개념

category AI 인공지능/AI Vision 2021. 9. 12. 14:31
728x90
반응형

Object Detection 이란?

객체 탐지(Object Detection)는 컴퓨터 비전 기술의 세부 분야중 하나로써 주어진 이미지내 사용자가 관심 있는 객체를 탐지하는 기술이다.

출처 : https://deepbaksuvision.github.io/Modu_ObjectDetection/posts/01_00_What_is_Object_Detection.html

활용분야

  • 자율 주행 자동차
  • CCTV 녹화
  • 마스크 얼굴 인식
  • 패션 분야에서 상의, 바지, 원피스등 해당 객체 인식

 

모델 형태

One-Stage Detector vs Two-Stage Detector

간단히 말해서 Classification (분류), Regional Proposal (영역제안)을 동시에 실행을 하는가 아니면 순차적으로 실행을 하는가에 대한 방법의 차이이다.

One-Stage Detector

출처 : https://pseudo-lab.github.io/Tutorial-Book/chapters/object-detection/Ch1-Object-Detection.html

Two-Stage Detector

출처 : https://pseudo-lab.github.io/Tutorial-Book/chapters/object-detection/Ch1-Object-Detection.html

모델 형태 정확도 속도
One-Stage Detector 정확도 ↓ 속도 ↑
Two-Stage Detector 정확도 ↑ 속도 ↓

모델

모델 종류 모델 형태 특징
R-CNN Two-Stage Detector - 이미지에서 객체 후보군을 생성
-  wrapping으로 이미지의 변형이나 손실이 발생하며큰 저장 공간이 필요하고 느리다
Fast R-CNN - Feature map에서 후보영역을 생성

Faster R-CNN - RPN 사용하여 Feature map에서 후보영역을 생성
YOLO One-Stage Detector - 일정 크기의 그리드로 나눠 각 그리드에 대한 Bounding-box를 예측
- 간단한 처리과정으로 속도가 매우 빠르지만 작은 객체에 대해서는 상대적으로 정확도가 낮음
SSD - NMS 알고리즘을 통해 최종 Bounding-box를 결정
- Feature map마다 스케일이 다르기 때문에 작은 물체와 큰 물체를 모두 탐지할 수 있다는 장점
RetinaNet - 손실 함수(loss function)에 변화를 주어 기존 One-Stage Detector들이 지닌 낮은 성능을 개선
-  RetinaNet은 속도 빠르면서 Two-Stage Detector와 유사한 성능
728x90
반응형

'AI 인공지능 > AI Vision' 카테고리의 다른 글

패션 의류 분류 (Fashion Classification)  (0) 2021.09.15
Fashion MNIST  (0) 2021.09.12
Faster-RCNN  (0) 2021.09.09
CNN (합성 신경망) 모델  (0) 2021.01.24
CNN (합성 신경망)  (0) 2020.12.22