Ⅰ. 연구 목적
CCTV,자율주행 자동차, 로봇 청소기, VR 등 다양한 산업과 상품에 쓰이는 객체 인식 기술에 담겨있는 수학적 알고리즘과 딥러닝을 이해하여 보다 더 빠르고, 정확한 계산을 위한 방안을 연구하고자 한다.
Ⅱ. 연구 내용
1. 논문의 모델 구조 분석, loss값 이해
Region proposal에 따라서 1-stage detector와 2-stage detector로 나뉘고 있다. 2-stage 방법의 시초라고 할수 있는 R-CNN논문은 객체 탐지를 위한 영역 제안(region proposal)에 CNN을 적용 시킨 논문이다. 이 아이디어는 CNN을 통해서 이미지분류 문제에는 성공하였는데 객체 탐지에는 적용 할수 있는 방법이 무엇일까라는 고민 끝에 나온 결과이다. 객체 분류 하는 문제와 경계 박스 추정하는 즉 분류와 회귀를 통해 원하는 결과를 이끌어 내는 방법이다.
먼저 입력 이미지를 받으면 selective search 알고리즘을 통해서 2000개의 후보 영역을 제안하고 CNN을 통해서 2000개 각각의 후보영역에서 feature를 연산합니다. 이때에 CNN 모델의 input shape(227 * 227)을 통일해서 모두 같은 크기의 후보영역을 통해 연산된 값을 서포트 벡터 머신을 이용해 분류 작업을 수행합니다. 그 후 bounding box regression을 통해서 후보영역의 위치를 더 정확하게 조절합니다. ****이 논문은 CNN을 적용했다는 의의가 있지만 단점으로써는 CNN input값을 wrap하였기 때문에 정보 손실이 일어난다 라는점과 2000개의 후보영역에 대해서 각각 CNN을 적용해야하기 때문에 학습시간이 오래 걸린다는 점입니다.