본문 바로가기
AI 인공지능/AI Vision

Object Detection 개념

by yscho03 2021. 9. 12.
728x90
반응형

Object Detection 이란?

객체 탐지(Object Detection)는 컴퓨터 비전 기술의 세부 분야중 하나로써 주어진 이미지내 사용자가 관심 있는 객체를 탐지하는 기술이다.

출처 : https://deepbaksuvision.github.io/Modu_ObjectDetection/posts/01_00_What_is_Object_Detection.html

활용분야

  • 자율 주행 자동차
  • CCTV 녹화
  • 마스크 얼굴 인식
  • 패션 분야에서 상의, 바지, 원피스등 해당 객체 인식

 

모델 형태

One-Stage Detector vs Two-Stage Detector

간단히 말해서 Classification (분류), Regional Proposal (영역제안)을 동시에 실행을 하는가 아니면 순차적으로 실행을 하는가에 대한 방법의 차이이다.

One-Stage Detector

출처 : https://pseudo-lab.github.io/Tutorial-Book/chapters/object-detection/Ch1-Object-Detection.html

Two-Stage Detector

출처 : https://pseudo-lab.github.io/Tutorial-Book/chapters/object-detection/Ch1-Object-Detection.html

모델 형태 정확도 속도
One-Stage Detector 정확도 ↓ 속도 ↑
Two-Stage Detector 정확도 ↑ 속도 ↓

모델

모델 종류 모델 형태 특징
R-CNN Two-Stage Detector - 이미지에서 객체 후보군을 생성
-  wrapping으로 이미지의 변형이나 손실이 발생하며큰 저장 공간이 필요하고 느리다
Fast R-CNN - Feature map에서 후보영역을 생성

Faster R-CNN - RPN 사용하여 Feature map에서 후보영역을 생성
YOLO One-Stage Detector - 일정 크기의 그리드로 나눠 각 그리드에 대한 Bounding-box를 예측
- 간단한 처리과정으로 속도가 매우 빠르지만 작은 객체에 대해서는 상대적으로 정확도가 낮음
SSD - NMS 알고리즘을 통해 최종 Bounding-box를 결정
- Feature map마다 스케일이 다르기 때문에 작은 물체와 큰 물체를 모두 탐지할 수 있다는 장점
RetinaNet - 손실 함수(loss function)에 변화를 주어 기존 One-Stage Detector들이 지닌 낮은 성능을 개선
-  RetinaNet은 속도 빠르면서 Two-Stage Detector와 유사한 성능
728x90
반응형

'AI 인공지능 > AI Vision' 카테고리의 다른 글

패션 의류 분류 (Fashion Classification)  (0) 2021.09.15
Fashion MNIST  (0) 2021.09.12
Faster-RCNN  (0) 2021.09.09
CNN (합성 신경망) 모델  (0) 2021.01.24
CNN (합성 신경망)  (0) 2020.12.22