- 참고
- https://velog.io/@hewas1230/ObjectDetection-Architecture
- https://deepbaksuvision.github.io/Modu_ObjectDetection/posts/01_00_What_is_Object_Detection.html
- https://developer-lionhong.tistory.com/34
- https://leedakyeong.tistory.com/entry/Object-Detection%EC%9D%B4%EB%9E%80-Object-Detection-%EC%9A%A9%EC%96%B4%EC%A0%95%EB%A6%AC
1. Object Detection(객체 탐지)
- 컴퓨터비전, 영상처리와 관계가 깊은 컴퓨터 기술
- 주요 개념
- 1. Class Classification
2. Bounding Box
3. IoU
4. Confidence Score
5. Precision, Recall, AP, mAP
6. NMS
7. Annotation
- 1. Class Classification
1.1. Class Classification
- Classification: 입력으로 들어온 이미지 안의 객체(object)의 종류(class)를 구분하는 것
- Localization: 단 하나의 Object 위치를 Bounding Box로 지정하여 찾음
- Object Detection: 여러 개의 Object들의 위치, class를 Bounding Box로 지정하여 분류함
1.2. Bounding Box
- 하나의 Object가 포함된 최소 크기 박스
- 위치 정보를 의미함
1.3. IoU(Intersection over Union)
- 두 박스의 중복 영역 크기를 통해 측정
- 겹치는 영역이 넓을수록 좋은 예측이라 할 수 있다.
- 0 ~ 1 사이의 값을 나타내며 값이 클수록(겹치는 영역이 넓을 수록) 좋은 예측
1.4. Confidence Score
- 찾은 Bounding Box 안에 물체가 있을 확률을 의미
- Predicted Bounding Box의 Confidence Score가 1에 가까울수록 모델은 Object가 있다고 판단
- 단순히 물체가 있을 확률로 계산되기도 하고,
물체가 있을 확률 * IoU로 계산되기도 하는 등
각 알고리즘마다 조금씩 차이가 있으나, 그 의미는 비슷함
1.5. Precision, Recall, AP, mAP
- AP: Average Precision
- mAP: mean Average Precision
- Confidence score threshold, IoU threshold 값에 따라 Precision, Recall 값이 변함
1.6. NMS(Non-Maximum Suppression)
- 동일 Object에 대해 가장 좋은 박스 한 개만 남기고 나머지 중복 박스를 제거하는 후처리 과정
- 1. Confidence score 임계값 이하의 Bounding Box 제거
2. 남은 Bounding Box들을 Confidence score 내림차순으로 정렬
3. 첫 Bounding Box(Confidence score가 가장 높은)와의 IoU 값이 임계값 이상인 다른 박스들을 제거
4. Bounding Box가 하나 될 때까지 반복
- 1. Confidence score 임계값 이하의 Bounding Box 제거
1.7. Annotation
- 이미지 안의 정보에 대해서 별도의 파일로 제공되는 것을 Annotation 파일이라고 함
- Annotation 파일에는 Object의 위치 정보, 클래스 정보, 클래스명 등의 정보가 있음
추가. Object Detection 구조
- Backbone
- 일반적인 CNN cell을 거쳐 평범하게 feature map을 생성하는 파트
- image를 다루므로 CNN architecture인 ImageNet, ResNet, VGG를 사용하는 경우가 많음
- Neck
- backbone과 head 사이를 이어주는 연결부
- backbone의 다른 stages에서 서로 다른 feature maps를 추출함
- Head
- Bounding boxes의 classification이나 regression같은 '검출'이 이루어지는 실질적인 부분
- Output은 네 개의 값 (x, y, h, w)과 k classes + 1의 확률 (+ 1은 배경을 위한 것) 형태
- 세 부분만 모아놓은 형태
'에이블스쿨 6기 DX 트랙 > 일일 복습' 카테고리의 다른 글
IT 인프라 - DAY. 03 (0) | 2024.11.27 |
---|---|
IT 인프라 - DAY. 01 (0) | 2024.11.25 |
딥러닝 2일차 (0) | 2024.11.06 |
딥러닝 4일차 (0) | 2024.11.04 |
딥러닝 1일차 (0) | 2024.10.30 |