Convolutional Neural Network (CNN)은 단일 라벨 이미지 분류 작업에서 유망한 성능을 입증했습니다.
그러나 CNN이 다중 레이블 이미지에 가장 잘 대처하는 방법은 주로 복잡한 기본 개체 레이아웃과 불충분 한 다중 레이블 훈련 이미지로 인해 여전히 열린 문제로 남아 있습니다.
이 작업에서 우리는 가설 -CNN- 풀링 (HCP)이라는 유연한 딥 CNN 인프라를 제안합니다. 여기서 임의의 수의 객체 세그먼트 가설을 입력으로 취한 다음 공유 CNN이 각 가설과 연결되고 마지막으로 CNN이 연결됩니다. 다양한 가설의 출력 결과는 최대 풀링으로 집계되어 궁극적 인 다중 레이블 예측을 생성합니다.
이 유연한 딥 CNN 인프라의 몇 가지 고유 한 특징은 다음과 같습니다.
1) 학습에 지상 진실 경계 상자 정보가 필요하지 않습니다.
2) 전체 HCP 인프라는 시끄러운 가설 및 / 또는 중복 가설에 견고합니다.
3) 명시적인 가설 레이블이 필요하지 않습니다.
4) 공유 된 CNN은 대규모 단일 라벨 이미지 데이터 세트 (예 : ImageNet)로 잘 사전 훈련 될 수 있습니다.
5) 다중 라벨 예측 결과를 자연스럽게 출력 할 수 있습니다.
Pascal VOC2007 및 VOC2012 다중 레이블 이미지 데이터 세트에 대한 실험 결과는 제안 된 HCP 인프라가 다른 최신 기술보다 우월함을 잘 보여줍니다. 특히, MAP는 HCP에서만 84.2 %, 보완적인 결과와의 융합 후 90.3 %에 도달했습니다. [47]은 VOC2012 데이터 세트에서 수작업으로 만든 기능을 기반으로하여 최신 데이터 세트를 크게 능가합니다. 7 % 이상의 마진.
'AI > 딥러닝' 카테고리의 다른 글
물체 감지 : 속도 및 정확도 비교 (더 빠른 R-CNN, R-FCN, SSD, FPN, RetinaNet 및 YOLOv3) (0) | 2021.06.28 |
---|---|
[Object Detection] Faster R-CNN, YOLO, SSD, CornerNet, CenterNet 논문 소개 (0) | 2021.06.28 |
[Object Detection] Darknet 학습 준비하기 (0) | 2021.06.04 |
DataSet, DataTable이란? (0) | 2021.06.04 |
GAN 동작 원리 (참고 링크) (0) | 2021.04.21 |
댓글