25篇最新CV領(lǐng)域綜述性論文速遞!涵蓋15個方向:目標(biāo)檢測/圖像處理/姿態(tài)估計/醫(yī)學(xué)影像
目標(biāo)檢測
1.?綜述:深度域適應(yīng)目標(biāo)檢測
標(biāo)題:Deep Domain Adaptive Object Detection: a Survey
作者:Wanyi Li, Peng Wang
鏈接:https://arxiv.org/abs/2002.06797
本文共梳理了40篇相關(guān)文獻(xiàn),由中科院自動化所學(xué)者發(fā)布?;谏疃葘W(xué)習(xí)(DL)的目標(biāo)檢測已經(jīng)取得了很大的進(jìn)展,這些方法通常假設(shè)有大量的帶標(biāo)簽的訓(xùn)練數(shù)據(jù)可用,并且訓(xùn)練和測試數(shù)據(jù)從相同的分布中提取。然而,這兩個假設(shè)在實踐中并不總是成立的。深域自適應(yīng)目標(biāo)檢測(DDAOD)作為一種新的學(xué)習(xí)范式應(yīng)運而生。本文綜述了深域自適應(yīng)目標(biāo)檢測方法的研究進(jìn)展。
2. 深度學(xué)習(xí)中的異常實例檢測:綜述
標(biāo)題:Anomalous Instance Detection in Deep Learning: A Survey
作者:Saikiran Bulusu, Dawn Song
鏈接:https://arxiv.org/abs/2003.06979
本文共梳理了119篇相關(guān)文獻(xiàn),由雪城大學(xué)學(xué)者發(fā)布。討論多種異常實例檢測方法,并分析了各種方法的相對優(yōu)勢和劣勢。
3. 使用移動攝像機(jī)檢測移動物體:全面綜述
標(biāo)題:Moving Objects Detection with a Moving Camera: A Comprehensive Review
作者:Marie-Neige Chapel, Thierry Bouwmans
鏈接:https://arxiv.org/abs/2001.05238
本文共梳理了347篇相關(guān)文獻(xiàn)。隨著移動傳感器的興起,研究移動相機(jī)逐漸變?yōu)闊衢T方向。本文對不同現(xiàn)有方法進(jìn)行了識別,并將其分為一個平面或多個兩類。在這兩個類別中,將各類方法分為8組:全景背景減法,雙攝像頭,運動補償,子空間分割,運動分割,平面+視差,多平面和按塊分割圖像。本文還對公開可用的數(shù)據(jù)集和評估指標(biāo)進(jìn)行了研究。
圖像分類
5. 圖像去噪深度學(xué)習(xí):綜述
標(biāo)題:Deep Learning on Image Denoising: An overview
作者:Chunwei Tian, Chia-Wen Lin
鏈接:https://arxiv.org/abs/1912.13171
本文梳理了238篇相關(guān)文獻(xiàn),由哈爾濱工業(yè)大學(xué)、廣東工業(yè)大學(xué)、清華大學(xué)學(xué)者共同發(fā)布。不同類型的處理噪聲深度學(xué)習(xí)方法存在巨大差異,而目前很少有相關(guān)研究來進(jìn)行相關(guān)總結(jié)。本文對圖像去噪中不同深度學(xué)習(xí)技術(shù)進(jìn)行了比較研究,分析不同方法的動機(jī)和原理,并在公共去噪數(shù)據(jù)集進(jìn)行比較。研究包括:(1). 加白噪聲圖像的CNN;(2)用于真實噪聲圖像的CNN;(3)用于盲噪聲去噪的CNN;(4)用于混合噪聲圖像的CNN。
圖像分割
6. 使用深度學(xué)習(xí)進(jìn)行圖像分割:綜述
標(biāo)題:Image Segmentation Using Deep Learning: A Survey
作者:Shervin Minaee, Demetri Terzopoulos
鏈接:https://arxiv.org/abs/2001.05566
本文梳理了172篇相關(guān)文獻(xiàn),對語義和實例分割文獻(xiàn)進(jìn)行了全面回顧,涵蓋了的各種開創(chuàng)性作品,包括全卷積像素標(biāo)記網(wǎng)絡(luò),編碼器-解碼器體系結(jié)構(gòu),多尺度以及基于金字塔的方法,遞歸網(wǎng)絡(luò),視覺注意模型以及對抗中的生成模型。
人臉識別
7. DeepFakes:面部操縱和偽造檢測綜述
標(biāo)題:DeepFakes and Beyond: A Survey of Face Manipulation and Fake Detection
作者:Ruben Tolosana, Javier Ortega-Garcia
鏈接:https://arxiv.org/abs/2001.00179
本文梳理了105篇相關(guān)文獻(xiàn),本文對操縱人臉的圖像技術(shù)(包括DeepFake方法)以及檢測此類技術(shù)的方法進(jìn)行了全面綜述。論述了四種類型的面部操作:全臉合成、面部身份交換(DeepFakes)、面部屬性操作以及面部表情操作。
姿態(tài)估計
8. 目標(biāo)姿態(tài)回顧:從3D邊界框檢測器到完整的6D姿態(tài)估計器
標(biāo)題:A Review on Object Pose Recovery: from 3D Bounding Box Detectors to Full 6D Pose Estimators
作者:Caner Sahin, Tae-Kyun Kim
鏈接:https://arxiv.org/abs/2001.10609
本文梳理了206篇相關(guān)文獻(xiàn),由倫敦帝國理工學(xué)院學(xué)者發(fā)布。本文對3D邊界框檢測器到完整的6D姿態(tài)估計器的物體姿態(tài)恢復(fù)方法的進(jìn)行了首次全面的綜述。基于數(shù)學(xué)模型,將各類方法分為分類,回歸,分類與回歸,模板匹配和點對特征匹配任務(wù)。
行為/動作識別
9. 基于3D骨架的動作識別學(xué)習(xí)方法的研究
標(biāo)題:A Survey on 3D Skeleton-Based Action Recognition Using Learning Method
作者:Bin Ren, Hong Liu
鏈接:https://arxiv.org/abs/2002.05907
本文梳理了81篇相關(guān)文獻(xiàn),由北京大學(xué)學(xué)者發(fā)布。本文強(qiáng)調(diào)了動作識別的必要性和3D骨架數(shù)據(jù)的重要性,然后以數(shù)據(jù)驅(qū)動的方式對基于遞歸神經(jīng)網(wǎng)絡(luò),基于卷積神經(jīng)網(wǎng)絡(luò)和基于圖卷積網(wǎng)絡(luò)的主流動作識別技術(shù)進(jìn)行了全面介紹,這也是第一次對使用3D骨架數(shù)據(jù)進(jìn)行基于深度學(xué)習(xí)的動作識別的全面研究。
人群計數(shù)
10. 基于CNN的密度估算和人群計數(shù):綜述
標(biāo)題:CNN-based Density Estimation and Crowd Counting: A Survey
作者:Guangshuai Gao, Yunhong Wang鏈接:https://arxiv.org/abs/2003.12783
本文梳理了222篇相關(guān)文獻(xiàn),由北京航空航天大學(xué)學(xué)者發(fā)布,基于CNN的密度圖估計方法,調(diào)研了220+工作,對人群計數(shù)進(jìn)行了全面系統(tǒng)的研究。同時根據(jù)評估指標(biāo),在人群統(tǒng)計數(shù)據(jù)集上選擇表現(xiàn)最好的三名,并分析其優(yōu)缺點。
醫(yī)學(xué)影像
11. 使用經(jīng)典和深層神經(jīng)網(wǎng)絡(luò)進(jìn)行的乳房組織病理學(xué)圖像分析的全面綜述
標(biāo)題:A Comprehensive Review for Breast Histopathology Image Analysis Using ?Classical and Deep Neural Networks
作者:Xiaomin Zhou, ?Tao Jiang
鏈接:https://arxiv.org/abs/2003.12255
本文梳理了180篇相關(guān)文獻(xiàn),由東北大學(xué)學(xué)者發(fā)布。對基于人工神經(jīng)網(wǎng)絡(luò)的BHIA技術(shù)進(jìn)行了全面概述,將BHIA系統(tǒng)分為經(jīng)典和深度神經(jīng)網(wǎng)絡(luò)以進(jìn)行深入研究,分析現(xiàn)有模型以發(fā)現(xiàn)最合適的算法,并提供可公開訪問的數(shù)據(jù)集。
12. 使用深度神經(jīng)網(wǎng)絡(luò)的醫(yī)學(xué)圖像配準(zhǔn):全面綜述
標(biāo)題:Medical Image Registration Using Deep Neural Networks: A Comprehensive Review
作者:Hamid Reza Boveiri, Ali Reza MehdiZadeh
鏈接:https://arxiv.org/abs/2002.03401
本文梳理了117篇相關(guān)文獻(xiàn),對使用深度神經(jīng)網(wǎng)絡(luò)進(jìn)行醫(yī)學(xué)圖像配準(zhǔn)的最新文獻(xiàn)進(jìn)行了全面回顧,系統(tǒng)地涵蓋了該領(lǐng)域的相關(guān)作品,包括關(guān)鍵概念,統(tǒng)計分析,關(guān)鍵技術(shù),主要貢獻(xiàn),挑戰(zhàn)和未來方向。
13. 邁向自動威脅檢測:X射線安全成像中深度學(xué)習(xí)進(jìn)展綜述
標(biāo)題:Towards Automatic Threat Detection: A Survey of Advances of Deep Learning within X-ray Security Imaging
作者:Samet Akcay, Toby Breckon
鏈接:https://arxiv.org/abs/2001.01293
本文梳理了151篇相關(guān)文獻(xiàn),由英國杜倫大學(xué)學(xué)者發(fā)布。本文分常規(guī)機(jī)器學(xué)習(xí)和當(dāng)代深度學(xué)習(xí)兩類來回顧X射線安全成像算法。將深度學(xué)習(xí)方法分為有監(jiān)督,半監(jiān)督和無監(jiān)督學(xué)習(xí),著重論述分類,檢測,分割和異常檢測任務(wù),同時包含有完善的X射線數(shù)據(jù)集。
14.?用于計算組織病理學(xué)的深度神經(jīng)網(wǎng)絡(luò)模型綜述
標(biāo)題:Deep neural network models for computational histopathology: A survey
作者:Chetan L. Srinidhi, Anne L. Martel
鏈接:https://arxiv.org/abs/1912.12378
本文梳理了130篇相關(guān)文獻(xiàn),由多倫多大學(xué)學(xué)者發(fā)布。本文對組織病理學(xué)圖像分析中使用的最新深度學(xué)習(xí)方法進(jìn)行了全面回顧,包括有監(jiān)督,弱監(jiān)督,無監(jiān)督,遷移學(xué)習(xí)等領(lǐng)域,并總結(jié)了幾個現(xiàn)有的開放數(shù)據(jù)集。
三維重建
15.?外部形狀對3D內(nèi)部結(jié)構(gòu)預(yù)測綜述
標(biāo)題:A Survey On 3D Inner Structure Prediction from its Outer Shape
作者:Mohamed Mejri, Cédric Pradalier
鏈接:https://arxiv.org/abs/2002.04571
本文梳理了81篇相關(guān)文獻(xiàn),由北京大學(xué)學(xué)者發(fā)布。由于過去與骨架數(shù)據(jù)相關(guān)內(nèi)容很少,本文是第一篇針對使用3D骨架數(shù)據(jù)進(jìn)行基于深度學(xué)習(xí)的動作識別進(jìn)行全面討論的研究。本文突出了動作識別和3D骨架數(shù)據(jù)的重要性,以數(shù)據(jù)驅(qū)動的方式對基于遞歸神經(jīng)網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)和圖卷積網(wǎng)絡(luò)的主流動作識別技術(shù)進(jìn)行了全面介紹。并介紹了最大的3D骨架數(shù)據(jù)集NTU-RGB+D及其新版本NTU-RGB+D 120,并論述了幾種現(xiàn)有的頂級算法。
三維點云
16.?點云的無目標(biāo)配準(zhǔn)綜述
標(biāo)題:Target-less registration of point clouds: A review
作者:Yue Pan
鏈接:https://arxiv.org/abs/1912.12756
本文對48篇文獻(xiàn)進(jìn)行了梳理,總結(jié)了無目標(biāo)點云配準(zhǔn)的基本工作,回顧了三種常用的配準(zhǔn)方法,即基于特征匹配的方法,迭代最近點算法和隨機(jī)假設(shè),并分析了這些方法的優(yōu)缺點,介紹它們的常見應(yīng)用場景。
OCR:
17. 手寫光學(xué)字符識別(OCR):綜合系統(tǒng)文獻(xiàn)綜述(SLR)
標(biāo)題:Handwritten Optical Character Recognition (OCR): A Comprehensive Systematic Literature Review (SLR)
作者:Jamshed Memon, Rizwan Ahmed Khan
鏈接:https://arxiv.org/abs/2001.00139
本文對142篇相關(guān)文獻(xiàn)進(jìn)行了梳理,總結(jié)了有關(guān)OCR的研究,綜述了2000年至2018年之間發(fā)布的研究文章,介紹OCR的最新結(jié)果和技術(shù),并分析研究差距,以總結(jié)研究方向。
深度depth相關(guān):
18. 基于深度學(xué)習(xí)的單目深度估計:綜述
標(biāo)題:Monocular Depth Estimation Based On Deep Learning: An Overview
作者:Chaoqiang Zhao, Feng Qian
鏈接:https://arxiv.org/abs/2003.06620
本文對119篇相關(guān)文獻(xiàn)進(jìn)行了梳理,由華東理工大學(xué)學(xué)者發(fā)布。隨著深度神經(jīng)網(wǎng)絡(luò)的迅速發(fā)展,基于深度學(xué)習(xí)的單眼深度估計已得到廣泛研究。為了提高深度估計的準(zhǔn)確性,提出了各種網(wǎng)絡(luò)框架,損失函數(shù)和訓(xùn)練策略。因此,本文綜述了當(dāng)前基于深度學(xué)習(xí)的單眼深度估計方法,總結(jié)了幾種基于深度學(xué)習(xí)的深度估計中廣泛使用的數(shù)據(jù)集和評價指標(biāo),同時根據(jù)不同的訓(xùn)練方式回顧了一些有代表性的現(xiàn)有方法:有監(jiān)督,無監(jiān)督和半監(jiān)督。
CNN
19.?卷積神經(jīng)網(wǎng)絡(luò)的概述論文:分析、應(yīng)用和展望
標(biāo)題:A Survey of Convolutional Neural Networks: Analysis, Applications, and Prospects
作者:Zewen Li, Wenjie Yang, Shouheng Peng, Fan Liu
鏈接:https://arxiv.org/abs/2004.02806
本文對119篇相關(guān)文獻(xiàn)進(jìn)行了梳理,由華東理工大學(xué)學(xué)者發(fā)布。本文旨在在卷積神經(jīng)網(wǎng)絡(luò)這個快速增長的領(lǐng)域中盡可能提供新穎的想法和前景,不僅涉及二維卷積,而且涉及一維和多維卷積。首先,本文簡要介紹了CNN的歷史并概述了CNN發(fā)展,介紹經(jīng)典CNN模型,重點論述使它們達(dá)到SOTA的關(guān)鍵因素,并通過實驗分析提供了一些經(jīng)驗法則,最后對一維,二維和多維卷積的應(yīng)用進(jìn)行了概述。
視覺常識/其他
20.?神經(jīng)網(wǎng)絡(luò)分類器的信息平面分析研究述評
標(biāo)題:On Information Plane Analyses of Neural Network Classifiers -- A Review
作者:Bernhard C. Geiger
鏈接:https://arxiv.org/abs/2003.09671?
21.?低功耗深度學(xué)習(xí)和計算機(jī)視覺方法的概述
標(biāo)題:A Survey of Methods for Low-Power Deep Learning and Computer Vision
作者:Abhinav Goel, George K. Thiruvathukal
鏈接:https://arxiv.org/abs/2003.11066
22. 深度學(xué)習(xí)遇到數(shù)據(jù)對齊時:深度注冊網(wǎng)絡(luò)(DRN)評述
標(biāo)題:When Deep Learning Meets Data Alignment: A Review on Deep Registration Networks (DRNs)
作者:Victor Villena-Martinez, Robert B. Fisher
鏈接:https://arxiv.org/abs/2003.03167
23. 面向消費設(shè)備的無限制掌紋識別:文獻(xiàn)綜述
標(biāo)題:Towards Unconstrained Palmprint Recognition on Consumer Devices: a Literature Review
作者:Adrian-S. Ungureanu, Peter Corcoran
鏈接:https://arxiv.org/abs/2003.00737
24.?基于地面紋理的本地化功能-綜述
標(biāo)題:Features for Ground Texture Based Localization -- A Survey
作者:Jan Fabian Schmid, ?Rudolf Mester
鏈接:https://arxiv.org/abs/2002.11948?
25. 從觀看到移動:視覺室內(nèi)導(dǎo)航(VIN)學(xué)習(xí)綜述
標(biāo)題:From Seeing to Moving: A Survey on Learning for Visual Indoor Navigation (VIN)
作者:Xin Ye, Yezhou Yang
鏈接:https://arxiv.org/abs/2002.11310