通往Anchor-Free的真相:Object Detection的正負樣本定義

Jia-Yau Shiau
AI Blog TW
Published in
21 min readNov 12, 2020

--

在物件偵測的發展中,Faster-RCNN所使用的anchor在往後的幾年主導了高精度detector的發展。隨著2019年許多高精度的anchor-free方法提出,anchor似乎已經不是高精度detector的必需品。如果說2019年是anchor-free大爆發的一年,那麼今年 (2020年) 就是深入研究anchor與object detection關係的一年。近期一派研究指出:其實anchor-based與anchor-free的關鍵差異在於正負樣本的定義,anchor只是一個恰好方便定義正負樣本的依據。而定義優質的正負樣本是訓練一個好的detector不可或缺的一步

追本溯源,正負樣本問題其實是dense object detection的根本性問題。因為正負樣本是訓練detector前必須定義的資訊,不論是focal lossOHEM (online hard example mining)試圖解決的樣本數不均問題,或者是今年 (2020年) MAL (Multiple Anchor Learning)ATSS (adaptive training sample selection)PAA (probability anchor assignment) 試圖處理的樣本定義問題。

Article cover with Canva (部分圖片來源)

文章難度:★★★★☆
閱讀建議: 文章第一段介紹 dense object detection的發起點與設計,並介紹在物件偵測任務中的正、負、忽略樣本。第二段介紹 anchor與 IoU threshold,並且討論 anchor-free與 anchor-based在正負樣本定義的差異。第三段則是介紹今年 (2020年) 兩個有名的 training sample selection / anchor assignment方法 ATSS與 PAA。整篇文章不細部討論其他如網路架構等內容,著重在物件偵測正負樣本的問題淵源與定義設計。
推薦背景知識: object detection, feature pyramid network, focal loss, RetinaNet, FCOS, IoU threshold, YOLO, Faster-RCNN.

Dense Object Detection

未知的物件數目

物件偵測在問題的本質有一個相當困難的點:無法預先知道有多少物件需要預測。換句話說,演算法的輸出為一組 (多個不定數量) 的物件描述

物件偵測並無法預先知道到底有多少物件要預測 (資料來源)

--

--