国产日韩欧美一区二区三区综合,日本黄色免费在线,国产精品麻豆欧美日韩ww,色综合狠狠操

極客小將

您現(xiàn)在的位置是:首頁 » scratch編程資訊

資訊內(nèi)容

CVPR2019 oral | ScratchDet ,從頭開始訓(xùn)練單步目標(biāo)檢測器

極客小將2021-01-21-
本文《ScratchDet: Training Single-Shot Object Detectors from Scratch》提出了一種從零開始訓(xùn)練的單步目標(biāo)檢測器ScratchDet, 并基于root-block設(shè)計了新的基礎(chǔ)網(wǎng)絡(luò)Root-ResNet。ScratchDe

本文《ScratchDet: Training Single-Shot Object Detectors from Scratch》提出了一種從零開始訓(xùn)練的單步目標(biāo)檢測器ScratchDet, 并基于root-block設(shè)計了新的基礎(chǔ)網(wǎng)絡(luò)Root-ResNet。ScratchDet的性能在現(xiàn)有從頭開始訓(xùn)練的目標(biāo)檢測模型中達到最佳,且優(yōu)于部分基于預(yù)訓(xùn)練基礎(chǔ)網(wǎng)絡(luò)的檢測模型。

upload/article/images/2021-01-21/7b21c7d0a51cf47ce6b2e49ef69d5234.jpg

論文地址:
https://arxiv.org/pdf/1810.08425.pdf
代碼地址:
https://github.com/KimSoybean/ScratchDet

引言

當(dāng)前最優(yōu)的目標(biāo)檢測框架基本都是以預(yù)訓(xùn)練的高精度分類網(wǎng)絡(luò)作為基礎(chǔ)網(wǎng)絡(luò),在其后增加相應(yīng)的檢測器并進行finetune。分類和檢測任務(wù)對于平移不變性的敏感程度并不相同,且基于finetune的方法不便于對基礎(chǔ)網(wǎng)絡(luò)進行修改。因此本文提出了一種從頭開始訓(xùn)練的目標(biāo)檢測器ScratchDet。

ScratchDet

BatchNorm用于從頭開始訓(xùn)練

BatchNorm使得優(yōu)化空間變得顯著平滑,誘導(dǎo)梯度產(chǎn)生更加可預(yù)測和穩(wěn)定的行為,從而允許更大的參數(shù)搜索空間和更快的收斂速度。本文以SSD作為研究和對比對象,原始的SSD中不包含BatchNorm。

BatchNorm用于基礎(chǔ)網(wǎng)絡(luò)

在SSD的基礎(chǔ)網(wǎng)絡(luò)中每一個卷積層后均添加BatchNorm,由表1中結(jié)果可以看出,當(dāng)學(xué)習(xí)率upload/article/images/2021-01-21/68b376dc50266ed15c07ecc24a2f66d2.jpg為0.001時,upload/article/images/2021-01-21/f44dd2dc1415169657331b03fa456c2b.jpg由67.6%提高至72.8%,同時由于BatchNorm使得優(yōu)化空間變得顯著平滑,從而可以使用更大的學(xué)習(xí)率進行訓(xùn)練,當(dāng)學(xué)習(xí)率upload/article/images/2021-01-21/68b376dc50266ed15c07ecc24a2f66d2.jpg增大到為0.05時,其upload/article/images/2021-01-21/f44dd2dc1415169657331b03fa456c2b.jpg則提升至78.7%

upload/article/images/2021-01-21/14515620d6a1aadeaf8a58d08d5de2c8.jpg表1 BatchNorm對目標(biāo)檢測網(wǎng)絡(luò)在VOC 2007 test上的性能的影響

BatchNorm用于檢測頭

通過圖1(b)和圖1(c)可知,當(dāng)用默認的學(xué)習(xí)率從頭開始訓(xùn)練SSD時,其梯度L2范數(shù)的波動較為劇烈,尤其是在訓(xùn)練的初始階段,使其損失產(chǎn)生突變,收斂于一個較差的局部最小值,這也有效解釋了為何使用較大學(xué)習(xí)率從頭訓(xùn)練SSD網(wǎng)絡(luò)時通常會導(dǎo)致梯度爆炸和較差的性能。

與之相比,在SSD檢測頭中增加BatchNorm,使得優(yōu)化空間更加平滑,upload/article/images/2021-01-21/003653bd6cff4835a151a4207426d908.jpg由67.6%提高至71.0%。在應(yīng)用較大學(xué)習(xí)率之后,其upload/article/images/2021-01-21/0beaa5664f06f4797c51bbd7473b6eb4.jpg則可提高至75.6%。同時,大的學(xué)習(xí)率有助于模型跳出較差的局部最優(yōu),產(chǎn)生更加穩(wěn)定的梯度。

upload/article/images/2021-01-21/394db8e52b9749302fefb88f43f95ad9.jpg圖1 BatchNorm用于檢測頭的效果

BatchNorm用于整個目標(biāo)檢測網(wǎng)絡(luò)

當(dāng)同時在基礎(chǔ)網(wǎng)絡(luò)和目標(biāo)檢測頭中使用BatchNorm,并采用0.05的學(xué)習(xí)率從頭訓(xùn)練,最終upload/article/images/2021-01-21/3f2bb08f14a3f8cfbab039dc2749f6b6.jpg可達到78.7%,性能超過基于預(yù)訓(xùn)練VGG網(wǎng)絡(luò)的SSD(upload/article/images/2021-01-21/f44dd2dc1415169657331b03fa456c2b.jpg為77.2%)。

基礎(chǔ)網(wǎng)絡(luò)改進

ResNet和VGG的性能分析

VGG-16和ResNet-101是SSD中兩個常用的基礎(chǔ)網(wǎng)絡(luò),總體來說,ResNet-101在分類性能上優(yōu)于VGG-16。但在輸入圖片尺寸相對較小(upload/article/images/2021-01-21/da3c718cedba77b53d5064da0dc1c23f.jpg)的數(shù)據(jù)集PASCAL VOC上,基于VGG-16的SSD其檢測精度卻優(yōu)于基于ResNet-101的模型。當(dāng)從ResNet-101第一個卷積層中移除下采樣操作后,其upload/article/images/2021-01-21/f44dd2dc1415169657331b03fa456c2b.jpg從73.1%提高至77.6%,表明該下采樣操作造成了較多的信息損失,對于模型的檢測精度有較大的負面影響,尤其是對于圖片中較小的目標(biāo)。

目標(biāo)檢測基礎(chǔ)網(wǎng)絡(luò)設(shè)計

為了在克服上述缺陷的同時保持基礎(chǔ)網(wǎng)絡(luò)強大的分類能力,本文基于原始SSD中的基礎(chǔ)網(wǎng)絡(luò)ResNet進行了改進,提出了新的結(jié)構(gòu),名為Root-ResNet,其核心思想是去除了原始ResNet第一個卷積層中的下采樣操作,并將upload/article/images/2021-01-21/eb5ea98552f7c00d2814d4cb948ab308.jpg的單步卷積替換成3個upload/article/images/2021-01-21/5353c8ee96505db58e0d03658a9f0ab2.jpg卷積的堆疊。該設(shè)計能使網(wǎng)絡(luò)捕獲更多的局部信息,從而為小目標(biāo)的檢測提取更加豐富有效的特征。同時本文將SSD中用于提取不同尺度特征的卷積層替換為多個殘差模塊,每個殘差模塊由兩個分支組成,一個分支是步幅為2的upload/article/images/2021-01-21/0b83a17498c237f106bbb005f7127738.jpg卷積,另一個分支則由兩個upload/article/images/2021-01-21/0b83a17498c237f106bbb005f7127738.jpg卷積堆疊而成,其中第一個卷積的步幅為2,第二個卷積的步幅為1,卷積的輸出通道數(shù)皆為128。

實驗結(jié)果

PASCAL VOC

upload/article/images/2021-01-21/587986064f91b3ee0c0c3015ef553d0d.jpg的圖像輸入下,ScratchDet的upload/article/images/2021-01-21/cb9cc42a9d4677713491abc3fefa9747.jpg在VOC 2007上達到80.4%,在從頭訓(xùn)練的檢測模型中達到最佳,同時也優(yōu)于預(yù)訓(xùn)練的單步檢測模型,如SSD300和DES300。而在VOC 2012上,ScratchDet的upload/article/images/2021-01-21/df743903dcfb0c169a171838c8db977c.jpg也達到78.5%,且與輸入圖像尺寸為upload/article/images/2021-01-21/448a97afa180897fb7d65c8791f3e753.jpg,基于預(yù)訓(xùn)練的雙步檢測網(wǎng)絡(luò)相比,如R-FCN,其https://cdn.china-scratch.com/timg/190702/1U6164D7-21.jpg值高出了0.9%。

https://cdn.china-scratch.com/timg/190702/1U61MX6-22.jpgScratchDet與其他目標(biāo)檢測模型在PASCAL VOC數(shù)據(jù)集上的性能對比

MS COCO

在MS COCO數(shù)據(jù)集上,ScratchDet的https://cdn.china-scratch.com/timg/190702/1U61G646-23.jpg為32.7%,遠優(yōu)于相似輸入尺寸的其他模型。對于Faster R-CNN 和 Deformable R-FCN等模型,其訓(xùn)練及驗證的圖像尺寸較大,公平起見,本文測試了ScratchDet的多尺度檢測結(jié)果,其https://cdn.china-scratch.com/timg/190702/1U61L247-24.jpg為39.1%,優(yōu)于具有較大輸入尺寸的單步及雙步目標(biāo)檢測模型。

https://cdn.china-scratch.com/timg/190702/1U61JO9-25.jpgScratchDet與其他目標(biāo)檢測模型在MS COCO數(shù)據(jù)集上的性能對比

結(jié)論

1.本文分析了BatchNorm在目標(biāo)檢測模型的基礎(chǔ)網(wǎng)絡(luò)及檢測頭中的作用,并實現(xiàn)了目標(biāo)檢測網(wǎng)絡(luò)的從頭開始訓(xùn)練。2.通過分析基于VGG和ResNet的SSD網(wǎng)絡(luò)的性能,提出了新的基礎(chǔ)網(wǎng)絡(luò)Root-ResNet用以進一步提高目標(biāo)檢測的精度。3.本文提出了一種從頭訓(xùn)練的新目標(biāo)檢測模型ScratchDet,與其他從頭訓(xùn)練的目標(biāo)檢測模型相比,該模型在VOC及COCO數(shù)據(jù)集上取得最佳性能,且優(yōu)于部分基于預(yù)訓(xùn)練基礎(chǔ)網(wǎng)絡(luò)的單步及雙步目標(biāo)檢測模型。

長按識別關(guān)注,獲取更多新鮮論文解讀

聲明:本文章由網(wǎng)友投稿作為教育分享用途,如有侵權(quán)原作者可通過郵件及時和我們聯(lián)系刪除

預(yù)約試聽課

已有385人預(yù)約都是免費的,你也試試吧...

主站蜘蛛池模板: 巴彦县| 土默特右旗| 黄平县| 广平县| 东阿县| 叙永县| 鹤庆县| 杭锦旗| 岑巩县| 河曲县| 綦江县| 金门县| 淄博市| 得荣县| 丰原市| 富阳市| 广汉市| 枣阳市| 习水县| 类乌齐县| 通州区| 全椒县| 封丘县| 濮阳市| 大石桥市| 青龙| 泾阳县| 龙南县| 峨山| 英山县| 苏州市| 西畴县| 芮城县| 丰城市| 郴州市| 茂名市| 渝北区| 兴义市| 德庆县| 江阴市| 乌鲁木齐县|