国产日韩欧美一区二区三区综合,日本黄色免费在线,国产精品麻豆欧美日韩ww,色综合狠狠操

極客小將

您現(xiàn)在的位置是:首頁 » scratch編程資訊

資訊內(nèi)容

CVPR2019 oral | ScratchDet,從頭開始訓(xùn)練單步目標(biāo)檢測器

極客小將2021-01-31-
本文《ScratchDet: Training Single-Shot Object Detectors from Scratch》提出了一種從零開始訓(xùn)練的單步目標(biāo)檢測器ScratchDet, 并基于root-block設(shè)計了新的基礎(chǔ)網(wǎng)絡(luò)Root-ResNet。ScratchDe

本文《ScratchDet: Training Single-Shot Object Detectors from Scratch》提出了一種從零開始訓(xùn)練的單步目標(biāo)檢測器ScratchDet, 并基于root-block設(shè)計了新的基礎(chǔ)網(wǎng)絡(luò)Root-ResNet。ScratchDet的性能在現(xiàn)有從頭開始訓(xùn)練的目標(biāo)檢測模型中達(dá)到最佳,且優(yōu)于部分基于預(yù)訓(xùn)練基礎(chǔ)網(wǎng)絡(luò)的檢測模型。

upload/article/images/2021-01-31/9713e3d6100b7aee2ab91bbd91ad0357.jpg

論文地址:
https://arxiv.org/pdf/1810.08425.pdf
代碼地址:
https://github.com/KimSoybean/ScratchDet

引言

當(dāng)前最優(yōu)的目標(biāo)檢測框架基本都是以預(yù)訓(xùn)練的高精度分類網(wǎng)絡(luò)作為基礎(chǔ)網(wǎng)絡(luò),在其后增加相應(yīng)的檢測器并進(jìn)行finetune。分類和檢測任務(wù)對于平移不變性的敏感程度并不相同,且基于finetune的方法不便于對基礎(chǔ)網(wǎng)絡(luò)進(jìn)行修改。因此本文提出了一種從頭開始訓(xùn)練的目標(biāo)檢測器ScratchDet。

ScratchDet

BatchNorm用于從頭開始訓(xùn)練

BatchNorm使得優(yōu)化空間變得顯著平滑,誘導(dǎo)梯度產(chǎn)生更加可預(yù)測和穩(wěn)定的行為,從而允許更大的參數(shù)搜索空間和更快的收斂速度。本文以SSD作為研究和對比對象,原始的SSD中不包含BatchNorm。

BatchNorm用于基礎(chǔ)網(wǎng)絡(luò)

在SSD的基礎(chǔ)網(wǎng)絡(luò)中每一個卷積層后均添加BatchNorm,由表1中結(jié)果可以看出,當(dāng)學(xué)習(xí)率upload/article/images/2021-01-31/57f9916a2c545b5bd3e82e1b3d0ee9da.jpg為0.001時,upload/article/images/2021-01-31/9415017157b7b3e6810521e9d48e8d5d.jpg由67.6%提高至72.8%,同時由于BatchNorm使得優(yōu)化空間變得顯著平滑,從而可以使用更大的學(xué)習(xí)率進(jìn)行訓(xùn)練,當(dāng)學(xué)習(xí)率upload/article/images/2021-01-31/051a69cc065790370001350c87ea3f9d.jpg增大到為0.05時,其upload/article/images/2021-01-31/c586f02d303ef5570320122a896fd3dc.jpg則提升至78.7%

upload/article/images/2021-01-31/07ca11f53e61d30193d8da811d9ba51f.jpg表1 BatchNorm對目標(biāo)檢測網(wǎng)絡(luò)在VOC 2007 test上的性能的影響

BatchNorm用于檢測頭

通過圖1(b)和圖1(c)可知,當(dāng)用默認(rèn)的學(xué)習(xí)率從頭開始訓(xùn)練SSD時,其梯度L2范數(shù)的波動較為劇烈,尤其是在訓(xùn)練的初始階段,使其損失產(chǎn)生突變,收斂于一個較差的局部最小值,這也有效解釋了為何使用較大學(xué)習(xí)率從頭訓(xùn)練SSD網(wǎng)絡(luò)時通常會導(dǎo)致梯度爆炸和較差的性能。

與之相比,在SSD檢測頭中增加BatchNorm,使得優(yōu)化空間更加平滑,upload/article/images/2021-01-31/c586f02d303ef5570320122a896fd3dc.jpg由67.6%提高至71.0%。在應(yīng)用較大學(xué)習(xí)率之后,其upload/article/images/2021-01-31/c586f02d303ef5570320122a896fd3dc.jpg則可提高至75.6%。同時,大的學(xué)習(xí)率有助于模型跳出較差的局部最優(yōu),產(chǎn)生更加穩(wěn)定的梯度。

upload/article/images/2021-01-31/7c214b6ca3a5d9adf288264d247abe3f.jpg圖1 BatchNorm用于檢測頭的效果

BatchNorm用于整個目標(biāo)檢測網(wǎng)絡(luò)

當(dāng)同時在基礎(chǔ)網(wǎng)絡(luò)和目標(biāo)檢測頭中使用BatchNorm,并采用0.05的學(xué)習(xí)率從頭訓(xùn)練,最終upload/article/images/2021-01-31/c586f02d303ef5570320122a896fd3dc.jpg可達(dá)到78.7%,性能超過基于預(yù)訓(xùn)練VGG網(wǎng)絡(luò)的SSDupload/article/images/2021-01-31/c586f02d303ef5570320122a896fd3dc.jpg為77.2%。

基礎(chǔ)網(wǎng)絡(luò)改進(jìn)

ResNet和VGG的性能分析

VGG-16和ResNet-101是SSD中兩個常用的基礎(chǔ)網(wǎng)絡(luò),總體來說,ResNet-101在分類性能上優(yōu)于VGG-16。但在輸入圖片尺寸相對較小(upload/article/images/2021-01-31/f9576adbca63e151d62773fd193f0f7a.jpg)的數(shù)據(jù)集PASCAL VOC上,基于VGG-16的SSD其檢測精度卻優(yōu)于基于ResNet-101的模型。當(dāng)從ResNet-101第一個卷積層中移除下采樣操作后,其upload/article/images/2021-01-31/c586f02d303ef5570320122a896fd3dc.jpg從73.1%提高至77.6%,表明該下采樣操作造成了較多的信息損失,對于模型的檢測精度有較大的負(fù)面影響,尤其是對于圖片中較小的目標(biāo)。

目標(biāo)檢測基礎(chǔ)網(wǎng)絡(luò)設(shè)計

為了在克服上述缺陷的同時保持基礎(chǔ)網(wǎng)絡(luò)強(qiáng)大的分類能力,本文基于原始SSD中的基礎(chǔ)網(wǎng)絡(luò)ResNet進(jìn)行了改進(jìn),提出了新的結(jié)構(gòu),名為Root-ResNet,其核心思想是去除了原始ResNet第一個卷積層中的下采樣操作,并將upload/article/images/2021-01-31/65a6483914b2cf2dd04e7f286313710a.jpg的單步卷積替換成3個upload/article/images/2021-01-31/f1b84a8942d4cacd8e19b113da9a3794.jpg卷積的堆疊。該設(shè)計能使網(wǎng)絡(luò)捕獲更多的局部信息,從而為小目標(biāo)的檢測提取更加豐富有效的特征。同時本文將SSD中用于提取不同尺度特征的卷積層替換為多個殘差模塊,每個殘差模塊由兩個分支組成,一個分支是步幅為2的upload/article/images/2021-01-31/60ad702694d3bdb8b70a2cec73d09600.jpg卷積,另一個分支則由兩個upload/article/images/2021-01-31/60ad702694d3bdb8b70a2cec73d09600.jpg卷積堆疊而成,其中第一個卷積的步幅為2,第二個卷積的步幅為1,卷積的輸出通道數(shù)皆為128。

實驗結(jié)果

PASCAL VOC

upload/article/images/2021-01-31/f9576adbca63e151d62773fd193f0f7a.jpg的圖像輸入下,ScratchDet的upload/article/images/2021-01-31/c586f02d303ef5570320122a896fd3dc.jpg在VOC 2007上達(dá)到80.4%,在從頭訓(xùn)練的檢測模型中達(dá)到最佳,同時也優(yōu)于預(yù)訓(xùn)練的單步檢測模型,如SSD300和DES300。而在VOC 2012上,ScratchDet的upload/article/images/2021-01-31/c586f02d303ef5570320122a896fd3dc.jpg也達(dá)到78.5%,且與輸入圖像尺寸為upload/article/images/2021-01-31/563c32f62508366ec1c401ffa67a1132.jpg,基于預(yù)訓(xùn)練的雙步檢測網(wǎng)絡(luò)相比,如R-FCN,其upload/article/images/2021-01-31/c586f02d303ef5570320122a896fd3dc.jpg值高出了0.9%。

https://cdn.china-scratch.com/timg/190601/112G31920-22.jpg表 2 ScratchDet與其他目標(biāo)檢測模型在PASCAL VOC數(shù)據(jù)集上的性能對比

MS COCO

在MS COCO數(shù)據(jù)集上,ScratchDet的https://cdn.china-scratch.com/timg/190601/112G35214-23.jpg為32.7%,遠(yuǎn)優(yōu)于相似輸入尺寸的其他模型。對于Faster R-CNN 和 Deformable R-FCN等模型,其訓(xùn)練及驗證的圖像尺寸較大,公平起見,本文測試了ScratchDet的多尺度檢測結(jié)果,其https://cdn.china-scratch.com/timg/190601/112G35214-23.jpg為39.1%,優(yōu)于具有較大輸入尺寸的單步及雙步目標(biāo)檢測模型。

https://cdn.china-scratch.com/timg/190601/112G3E48-25.jpg表 3 ScratchDet與其他目標(biāo)檢測模型在MS COCO數(shù)據(jù)集上的性能對比

結(jié)論

(1)本文分析了BatchNorm在目標(biāo)檢測模型的基礎(chǔ)網(wǎng)絡(luò)及檢測頭中的作用,并實現(xiàn)了目標(biāo)檢測網(wǎng)絡(luò)的從頭開始訓(xùn)練。

(2)通過分析基于VGG和ResNet的SSD網(wǎng)絡(luò)的性能,提出了新的基礎(chǔ)網(wǎng)絡(luò)Root-ResNet用以進(jìn)一步提高目標(biāo)檢測的精度。

(3)本文提出了一種從頭訓(xùn)練的新目標(biāo)檢測模型ScratchDet,與其他從頭訓(xùn)練的目標(biāo)檢測模型相比,該模型在VOC及COCO數(shù)據(jù)集上取得最佳性能,且優(yōu)于部分基于預(yù)訓(xùn)練基礎(chǔ)網(wǎng)絡(luò)的單步及雙步目標(biāo)檢測模型。


長按識別關(guān)注,獲取更多新鮮論文解讀

聲明:本文章由網(wǎng)友投稿作為教育分享用途,如有侵權(quán)原作者可通過郵件及時和我們聯(lián)系刪除

預(yù)約試聽課

已有385人預(yù)約都是免費(fèi)的,你也試試吧...

主站蜘蛛池模板: 义马市| 兰州市| 沂水县| 万山特区| 遂昌县| 青浦区| 绍兴县| 富顺县| 宁城县| 泰顺县| 中阳县| 资中县| 巨鹿县| 古蔺县| 聂荣县| 新乐市| 收藏| 新丰县| 万盛区| 平遥县| 江阴市| 汉川市| 龙陵县| 花莲县| 河西区| 梅州市| 南木林县| 西畴县| 延津县| 积石山| 七台河市| 淮安市| 武汉市| 石柱| 前郭尔| 洮南市| 九寨沟县| 西乌| 青龙| 乌恰县| 车险|