본문 바로가기

Data/논문 & 모델 정리

[Model] SSD (Single Shot Detection)

반응형
  • 참고 자료
  • 논문 컨셉
    • 처음 알게된 모델이다… Object Detection에서 활용되고있는 모델이다.
    • One-Stage 모델중 하나이다. 여기서 One-Stage란?
      • One-Stage말고도 Two-Stage도 있는데. 여기서 Two는 위 그림처럼 “Region Proposal” & “Object Detection” 단계를 분리해 전개되는 모델이다. 즉, One같은 경우에는 이 두개를 분리하지않고 한 번에 수행하는 모델임
      • Object Detection분야에서 “객체를 얼마나 잘 탐지하는지” 외에도, “객체를 얼마나 빨리 탐지하는지” 도 중요하기 때문이다.
        • 예시로는 자율 주행 산업에서 이를 굉장히 중요시 여긴다고한다… 빨리 탐지하지 못하면 사고가 일어날수있기때문이다
      • Two-Stage는 One-Stage보다 느린 탐지 속도를 가지고 있다고 한다
    • SSD 모델이 나오기 이전에 One-Stage 모델로서 YOLO(You Only Look Once) 버전 1이 개발되었음. YOLO는 탐지 속도는 매우 높았지만, 성능면에서는 매우 낮은 성능을 기록함. 이때 YOLOv1을 개선하고자 나온 모델이 SSD임.
  • 모델 특징
    • SSD 모델은 Multi-Scale Feature Layer 와 Default Box(또는 Anchor Box)라는 2개의 요소로 구성되어있음
    • Multi-Scale Feature Layer
      • 여러 번의 Convolution을 적용해 나온 여러 개의 Feature Map을 Object Detection을 수행시키고 그 결과를 통합해 최종 Detection하는 과정
      • 위 그림에서 32, 16, 8. 4일 때 각각에 대해 Object Detection을 수행한다
    • Default Box (Anchor Box)
      • Convolution을 통해 나온 각각의 Feature Map의 포인터마다 여러개의 Anchor Box를 씌우고 Ground Truth와 비료를 하면서 학습을 진행
      • 이렇게 학습을 진행하면, 매번 Feature Map에서 나오는 이미지에서 각자 잘 탐지할수있는 Object들이 생길것이다.
        • 즉, Feature Map1에서는 학습을 할수록 “사람 손” 인식을 잘하는 탐지 모델이 될것이고. Feature Map2에서는 “강아지” 탐지를 잘하는 모델이 될것이다.
      • 이러한 과정으로 인해 SSD는 이미지 속에 존재하는 여러가지 Object들을 잘 탐지할 수 있게 된다
    • 모델이 모든 과정을 거쳐 객체를 탐지하이 위한 많은 후보의 Bounding Box들이 생겨났을건데. 이제 Ground Truth와 가장 IoU가 높은 Bounding Box들만 남기기 위해서 NMS기법을 사용한다.
      • IoU - Intersection over Union의 약자
        • 값이 1로 갈수록 객체 탐지 모델이 잘 예측한 것을 의미한다
        • “실제 객체가 있는 바운딩 박스”와 “모델이 예측한 바운딩 박스가 포함하고 있는 영역”을 계산할 수 있음
      • NMS - Non-Max Suppression 의 약자
  • 모델 구조
    • 위 그림으로 대체한다
반응형