본문 바로가기
AI/딥러닝

CNN: Single-label to Multi-label

by 꼬바리 2021. 6. 4.

 

Convolutional Neural Network (CNN)은 단일 라벨 이미지 분류 작업에서 유망한 성능을 입증했습니다. 

 

그러나 CNN이 다중 레이블 이미지에 가장 잘 대처하는 방법은 주로 복잡한 기본 개체 레이아웃과 불충분 한 다중 레이블 훈련 이미지로 인해 여전히 열린 문제로 남아 있습니다. 

 

이 작업에서 우리는 가설 -CNN- 풀링 (HCP)이라는 유연한 딥 CNN 인프라를 제안합니다. 여기서 임의의 수의 객체 세그먼트 가설을 입력으로 취한 다음 공유 CNN이 각 가설과 연결되고 마지막으로 CNN이 연결됩니다. 다양한 가설의 출력 결과는 최대 풀링으로 집계되어 궁극적 인 다중 레이블 예측을 생성합니다. 

 

이 유연한 딥 CNN 인프라의 몇 가지 고유 한 특징은 다음과 같습니다.

 

1) 학습에 지상 진실 경계 상자 정보가 필요하지 않습니다. 

2) 전체 HCP 인프라는 시끄러운 가설 및 / 또는 중복 가설에 견고합니다. 

3) 명시적인 가설 레이블이 필요하지 않습니다. 

4) 공유 된 CNN은 대규모 단일 라벨 이미지 데이터 세트 (예 : ImageNet)로 잘 사전 훈련 될 수 있습니다. 

5) 다중 라벨 예측 결과를 자연스럽게 출력 할 수 있습니다.

 

Pascal VOC2007 및 VOC2012 다중 레이블 이미지 데이터 세트에 대한 실험 결과는 제안 된 HCP 인프라가 다른 최신 기술보다 우월함을 잘 보여줍니다. 특히, MAP는 HCP에서만 84.2 %, 보완적인 결과와의 융합 후 90.3 %에 도달했습니다. [47]은 VOC2012 데이터 세트에서 수작업으로 만든 기능을 기반으로하여 최신 데이터 세트를 크게 능가합니다. 7 % 이상의 마진.

 

출처 : https://arxiv.org/abs/1406.5726

728x90
반응형

댓글