에이블스쿨 6기 DX 트랙/일일 복습

딥러닝 심화: Object Detection

d061120 2024. 11. 8. 19:07

 

1. Object Detection(객체 탐지)

  • 컴퓨터비전, 영상처리와 관계가 깊은 컴퓨터 기술
  • 주요 개념
    • 1. Class Classification
      2. Bounding Box
      3. IoU
      4. Confidence Score
      5. Precision, Recall, AP, mAP
      6. NMS
      7. Annotation

1.1. Class Classification

사진출처: https://deepbaksuvision.github.io/Modu_ObjectDetection/posts/01_00_What_is_Object_Detection.html

  • Classification: 입력으로 들어온 이미지 안의 객체(object)의 종류(class)를 구분하는 것
  • Localization: 단 하나의 Object 위치를 Bounding Box로 지정하여 찾음
  • Object Detection: 여러 개의 Object들의 위치, class를 Bounding Box로 지정하여 분류함

 

1.2. Bounding Box

  • 하나의 Object가 포함된 최소 크기 박스
  • 위치 정보를 의미함

 

1.3. IoU(Intersection over Union)

  • 두 박스의 중복 영역 크기를 통해 측정
  • 겹치는 영역이 넓을수록 좋은 예측이라 할 수 있다.
  • 0 ~ 1 사이의 값을 나타내며 값이 클수록(겹치는 영역이 넓을 수록) 좋은 예측

 

1.4. Confidence Score

  • 찾은 Bounding Box 안에 물체가 있을 확률을 의미
  • Predicted Bounding Box의 Confidence Score가 1에 가까울수록 모델은 Object가 있다고 판단
  • 단순히 물체가 있을 확률로 계산되기도 하고,
    물체가 있을 확률 * IoU로 계산되기도 하는 등
    각 알고리즘마다 조금씩 차이가 있으나, 그 의미는 비슷함

 

1.5. Precision, Recall, AP, mAP

  • AP: Average Precision
  • mAP: mean Average Precision

  • Confidence score threshold, IoU threshold 값에 따라 Precision, Recall 값이 변함

 

1.6. NMS(Non-Maximum Suppression)

  • 동일 Object에 대해 가장 좋은 박스 한 개만 남기고 나머지 중복 박스를 제거하는 후처리 과정
    • 1. Confidence score 임계값 이하의 Bounding Box 제거
      2. 남은 Bounding Box들을 Confidence score 내림차순으로 정렬
      3. 첫 Bounding Box(Confidence score가 가장 높은)와의 IoU 값이 임계값 이상인 다른 박스들을 제거
      4. Bounding Box가 하나 될 때까지 반복

 

1.7. Annotation

  • 이미지 안의 정보에 대해서 별도의 파일로 제공되는 것을 Annotation 파일이라고 함
  • Annotation 파일에는 Object의 위치 정보, 클래스 정보, 클래스명 등의 정보가 있음

 

추가. Object Detection 구조

사진출처: chrome-extension://efaidnbmnnnibpcajpcglclefindmkaj/https://arxiv.org/pdf/2004.10934

  • Backbone
    • 일반적인 CNN cell을 거쳐 평범하게 feature map을 생성하는 파트
    • image를 다루므로 CNN architecture인 ImageNet, ResNet, VGG를 사용하는 경우가 많음
  • Neck
    • backbone과 head 사이를 이어주는 연결부
    • backbone의 다른 stages에서 서로 다른 feature maps를 추출함
  • Head
    • Bounding boxes의 classification이나 regression같은 '검출'이 이루어지는 실질적인 부분
    • Output은 네 개의 값 (x, y, h, w)과 k classes + 1의 확률 (+ 1은 배경을 위한 것) 형태
  • 세 부분만 모아놓은 형태

사진출처: https://velog.io/@hewas1230/ObjectDetection-Architectur

'에이블스쿨 6기 DX 트랙 > 일일 복습' 카테고리의 다른 글

IT 인프라 - DAY. 03  (0) 2024.11.27
IT 인프라 - DAY. 01  (0) 2024.11.25
딥러닝 2일차  (0) 2024.11.06
딥러닝 4일차  (0) 2024.11.04
딥러닝 1일차  (0) 2024.10.30