您現(xiàn)在的位置是：首頁 » scratch編程資訊

資訊內(nèi)容

CVPR2019 oral | ScratchDet，從頭開始訓(xùn)練單步目標(biāo)檢測器

極客小將2021-01-31-

本文《ScratchDet: Training Single-Shot Object Detectors from Scratch》提出了一種從零開始訓(xùn)練的單步目標(biāo)檢測器ScratchDet，并基于root-block設(shè)計了新的基礎(chǔ)網(wǎng)絡(luò)Root-ResNet。ScratchDet的性能在現(xiàn)有從頭開始訓(xùn)練的目標(biāo)檢測模型中達(dá)到最佳，且優(yōu)于部分基于預(yù)訓(xùn)練基礎(chǔ)網(wǎng)絡(luò)的檢測模型。

upload/article/images/2021-01-31/9713e3d6100b7aee2ab91bbd91ad0357.jpg

論文地址:
https://arxiv.org/pdf/1810.08425.pdf
代碼地址:
https://github.com/KimSoybean/ScratchDet

引言

當(dāng)前最優(yōu)的目標(biāo)檢測框架基本都是以預(yù)訓(xùn)練的高精度分類網(wǎng)絡(luò)作為基礎(chǔ)網(wǎng)絡(luò)，在其后增加相應(yīng)的檢測器并進(jìn)行finetune。分類和檢測任務(wù)對于平移不變性的敏感程度并不相同，且基于finetune的方法不便于對基礎(chǔ)網(wǎng)絡(luò)進(jìn)行修改。因此本文提出了一種從頭開始訓(xùn)練的目標(biāo)檢測器ScratchDet。

ScratchDet

BatchNorm用于從頭開始訓(xùn)練

BatchNorm使得優(yōu)化空間變得顯著平滑，誘導(dǎo)梯度產(chǎn)生更加可預(yù)測和穩(wěn)定的行為，從而允許更大的參數(shù)搜索空間和更快的收斂速度。本文以SSD作為研究和對比對象，原始的SSD中不包含BatchNorm。

BatchNorm用于基礎(chǔ)網(wǎng)絡(luò)

在SSD的基礎(chǔ)網(wǎng)絡(luò)中每一個卷積層后均添加BatchNorm，由表1中結(jié)果可以看出，當(dāng)學(xué)習(xí)率 upload/article/images/2021-01-31/57f9916a2c545b5bd3e82e1b3d0ee9da.jpg 為0.001時，由67.6%提高至72.8%，同時由于BatchNorm使得優(yōu)化空間變得顯著平滑，從而可以使用更大的學(xué)習(xí)率進(jìn)行訓(xùn)練，當(dāng)學(xué)習(xí)率增大到為0.05時，其 upload/article/images/2021-01-31/c586f02d303ef5570320122a896fd3dc.jpg 則提升至78.7%

upload/article/images/2021-01-31/07ca11f53e61d30193d8da811d9ba51f.jpg

表1 BatchNorm對目標(biāo)檢測網(wǎng)絡(luò)在VOC 2007 test上的性能的影響

BatchNorm用于檢測頭

通過圖1（b）和圖1（c）可知，當(dāng)用默認(rèn)的學(xué)習(xí)率從頭開始訓(xùn)練SSD時，其梯度L2范數(shù)的波動較為劇烈，尤其是在訓(xùn)練的初始階段，使其損失產(chǎn)生突變，收斂于一個較差的局部最小值，這也有效解釋了為何使用較大學(xué)習(xí)率從頭訓(xùn)練SSD網(wǎng)絡(luò)時通常會導(dǎo)致梯度爆炸和較差的性能。

與之相比，在SSD檢測頭中增加BatchNorm，使得優(yōu)化空間更加平滑， upload/article/images/2021-01-31/c586f02d303ef5570320122a896fd3dc.jpg 由67.6%提高至71.0%。在應(yīng)用較大學(xué)習(xí)率之后，其則可提高至75.6%。同時，大的學(xué)習(xí)率有助于模型跳出較差的局部最優(yōu)，產(chǎn)生更加穩(wěn)定的梯度。

upload/article/images/2021-01-31/7c214b6ca3a5d9adf288264d247abe3f.jpg

圖1 BatchNorm用于檢測頭的效果

BatchNorm用于整個目標(biāo)檢測網(wǎng)絡(luò)

當(dāng)同時在基礎(chǔ)網(wǎng)絡(luò)和目標(biāo)檢測頭中使用BatchNorm，并采用0.05的學(xué)習(xí)率從頭訓(xùn)練，最終 upload/article/images/2021-01-31/c586f02d303ef5570320122a896fd3dc.jpg 可達(dá)到78.7%，性能超過基于預(yù)訓(xùn)練VGG網(wǎng)絡(luò)的SSD為77.2%。

基礎(chǔ)網(wǎng)絡(luò)改進(jìn)

ResNet和VGG的性能分析

VGG-16和ResNet-101是SSD中兩個常用的基礎(chǔ)網(wǎng)絡(luò)，總體來說，ResNet-101在分類性能上優(yōu)于VGG-16。但在輸入圖片尺寸相對較小（ upload/article/images/2021-01-31/f9576adbca63e151d62773fd193f0f7a.jpg ）的數(shù)據(jù)集PASCAL VOC上，基于VGG-16的SSD其檢測精度卻優(yōu)于基于ResNet-101的模型。當(dāng)從ResNet-101第一個卷積層中移除下采樣操作后，其從73.1%提高至77.6%，表明該下采樣操作造成了較多的信息損失，對于模型的檢測精度有較大的負(fù)面影響，尤其是對于圖片中較小的目標(biāo)。

目標(biāo)檢測基礎(chǔ)網(wǎng)絡(luò)設(shè)計

為了在克服上述缺陷的同時保持基礎(chǔ)網(wǎng)絡(luò)強(qiáng)大的分類能力，本文基于原始SSD中的基礎(chǔ)網(wǎng)絡(luò)ResNet進(jìn)行了改進(jìn)，提出了新的結(jié)構(gòu)，名為Root-ResNet，其核心思想是去除了原始ResNet第一個卷積層中的下采樣操作，并將 upload/article/images/2021-01-31/65a6483914b2cf2dd04e7f286313710a.jpg 的單步卷積替換成3個卷積的堆疊。該設(shè)計能使網(wǎng)絡(luò)捕獲更多的局部信息，從而為小目標(biāo)的檢測提取更加豐富有效的特征。同時本文將SSD中用于提取不同尺度特征的卷積層替換為多個殘差模塊，每個殘差模塊由兩個分支組成，一個分支是步幅為2的 upload/article/images/2021-01-31/60ad702694d3bdb8b70a2cec73d09600.jpg 卷積，另一個分支則由兩個卷積堆疊而成，其中第一個卷積的步幅為2，第二個卷積的步幅為1，卷積的輸出通道數(shù)皆為128。

實驗結(jié)果

PASCAL VOC

在 upload/article/images/2021-01-31/f9576adbca63e151d62773fd193f0f7a.jpg 的圖像輸入下，ScratchDet的在VOC 2007上達(dá)到80.4%，在從頭訓(xùn)練的檢測模型中達(dá)到最佳，同時也優(yōu)于預(yù)訓(xùn)練的單步檢測模型，如SSD300和DES300。而在VOC 2012上，ScratchDet的 upload/article/images/2021-01-31/c586f02d303ef5570320122a896fd3dc.jpg 也達(dá)到78.5%，且與輸入圖像尺寸為，基于預(yù)訓(xùn)練的雙步檢測網(wǎng)絡(luò)相比，如R-FCN，其值高出了0.9%。

https://cdn.china-scratch.com/timg/190601/112G31920-22.jpg

表 2 ScratchDet與其他目標(biāo)檢測模型在PASCAL VOC數(shù)據(jù)集上的性能對比

MS COCO

在MS COCO數(shù)據(jù)集上，ScratchDet的為32.7%，遠(yuǎn)優(yōu)于相似輸入尺寸的其他模型。對于Faster R-CNN 和 Deformable R-FCN等模型，其訓(xùn)練及驗證的圖像尺寸較大，公平起見，本文測試了ScratchDet的多尺度檢測結(jié)果，其為39.1%，優(yōu)于具有較大輸入尺寸的單步及雙步目標(biāo)檢測模型。

https://cdn.china-scratch.com/timg/190601/112G3E48-25.jpg

表 3 ScratchDet與其他目標(biāo)檢測模型在MS COCO數(shù)據(jù)集上的性能對比

結(jié)論

(1)本文分析了BatchNorm在目標(biāo)檢測模型的基礎(chǔ)網(wǎng)絡(luò)及檢測頭中的作用，并實現(xiàn)了目標(biāo)檢測網(wǎng)絡(luò)的從頭開始訓(xùn)練。

(2)通過分析基于VGG和ResNet的SSD網(wǎng)絡(luò)的性能，提出了新的基礎(chǔ)網(wǎng)絡(luò)Root-ResNet用以進(jìn)一步提高目標(biāo)檢測的精度。

(3)本文提出了一種從頭訓(xùn)練的新目標(biāo)檢測模型ScratchDet，與其他從頭訓(xùn)練的目標(biāo)檢測模型相比，該模型在VOC及COCO數(shù)據(jù)集上取得最佳性能，且優(yōu)于部分基于預(yù)訓(xùn)練基礎(chǔ)網(wǎng)絡(luò)的單步及雙步目標(biāo)檢測模型。

長按識別關(guān)注，獲取更多新鮮論文解讀

聲明：本文章由網(wǎng)友投稿作為教育分享用途，如有侵權(quán)原作者可通過郵件及時和我們聯(lián)系刪除

上一篇
少兒創(chuàng)意編程（特20）scratch之玩轉(zhuǎn)貪吃蛇

下一篇
[推薦]《課堂中的Scratch》

《課堂中的 Scrat

相關(guān)資訊

預(yù)約試聽課

已有385人預(yù)約都是免費(fèi)的，你也試試吧...

精品課程

Scratch自學(xué)精品課程(45節(jié)課)目...

官方教程 10、錄制聲音

官方教程 9、制作音樂

官方教程 8、創(chuàng)作故事

官方教程 7、角色動畫

推薦下載

Scratch 3.29.1 Windows版 Mac...

Scratch 3.26.0 Setup Windows...

Scratch 3.26 Mac版本官方下載...

scratchlink 下載

Scratch 3.23.1 Mac版本官方下...

Scratch 3.23.1 Setup Windows...

Scratch 3.22.0 Mac版本官方下...

Scratch 3.22.0 Setup Windows...

標(biāo)簽云

Scratch(112) python(56) 少兒編程(44) 藍(lán)橋杯(32) 小升初(20) Scratch教材(19) 清華大學(xué)出版社(19) 電子學(xué)會(17) 等級考試(15) scratch作品(13) 真題(11) 數(shù)學(xué)(10) 人工智能(10) 算法(9) scratch等級(9) 四級考試(9) 三級考試(9) 電子協(xié)會(9) Scratch下載(9) 字典(6)

猜你喜歡

認(rèn)識Scratch的舞臺

Scratch電子學(xué)會等級考試時間和...

Scratch考試將會在近期進(jìn)行全面...

Scratch編程：培養(yǎng)孩子創(chuàng)新思維...

學(xué)Scratch編程的費(fèi)用一般是多少

Scratch教程：進(jìn)階課程-打地鼠

Scratch教程：進(jìn)階課程-打蝙蝠...

scratch教程判斷 if then

Scratch計算三角形面積

Scratch會飛的巫婆

Scratch迷宮游戲設(shè)計