所在位置: 首页  综合事务  科研动态>正文
我校信息学院于计算机视觉与模式识别领域发表多项重要研究成果
发布时间:2020-03-03

近日,信息学院于计算机视觉与模式识别领域顶级国际会议《IEEE Conference on Computer Vision and Pattern Recognition》上发表多项重要研究成果: 

1.Harmonizing Transferability and Discriminability for Adapting Object Detectors

本文第一作者分别是厦门大学信息与通信工程系2017级硕士生陈超奇,通讯作者是黄悦副教授。本文提出了一个分层可迁移性性校准模型,用于无监督跨域目标检测任务。本文的核心思路在于协调与平衡传统无监督域对抗方法中存在的特征的可迁移性和判别性的矛盾,通过在不同层次校准特征的可迁移性来提高其判别性从实现细粒度的跨域特征对齐。该模型在多个跨域检测公开任务上均取得最优性能。

 

 

2.LT-Net:Label Transferby Learning ReversibleVoxel-wise Correspondence for One-shot Medical Image Segmentation

本文的第一作者是信息学院计算机科学系2017级硕士研究生王淑欣,通讯作者是王连生副教授。该论文针对医学数据标注难以获得的问题,提出了一个one-shot脑组织结构分割网络LT-Net。该网络学习一例标注数据与所有未标注数据之间的相关性,并将此相关性应用到标注数据的标注上,从而可以得到未标注数据的标注信息。

 

 

3.HRank: Filter Pruning using High-Rank Feature Map

本文的第一作者是厦门大学人工智能系2018级博士研究生林明宝,通讯作者是其导师纪荣嵘教授。本文提出了一种神经网络剪枝的算法,本文首次发现无论输入图片的数量是多少,每个卷积核所产生的特征图的平均的秩都不变。在此基础上,我们证明了秩较小的特征图包含的信息量较少,因此,产生低秩特征图的卷积核可以相对应裁剪掉,仅需要保留高秩特征图对应的卷积核。该算法在各类分类网络上均取得了较大的性能提升,达到了较高的压缩比。

 

 

4.Noise-Aware Fully Webly Supervised Object Detection

本文一作是厦门大学人工智能系2017级博士研究生沈云航,通讯作者是其导师纪荣嵘教授。该论文首次提出一种基于全网络监督的目标检测,即只使用网络爬取的图片来训练目标检测器。由于网络图像和标签带有很多噪声,我们首先把噪声分为两种:前景噪声和前景缺失。我们提出一种噪声分解框架和空间敏感的熵准则来减低前景噪声的负面影响,同时提出一种打包混合策略来减少前景缺失带来的负面影响。实验结果表明该算法性能baseline算法在PASCAL VOC和COCO数据类别上分别有很大的性能提升。

 

 

5.Rethinking Performance Estimation in Neural Architecture Search

本文一作为厦门大学人工智能系2018级博士研究生郑侠武,通讯作者是其导师纪荣嵘教授。神经网络结构搜索(NAS)仍然是一个具有挑战性的问题,这归因于性能评估(P必不可少且耗时。在本文中,我们提供了一种在资源受限的环境下对精度估计进行新颖而又系统的重新思考的方法,称为BPE,它可以精确,有效地估算从神经网络结构检索空间采样的结构的性能。由于搜索最佳的BPE非常耗时,因为它需要训练大量网络进行评估,因此我们提出一种最小重要性修剪(MIP)方法。给定一个数据集和一个BPE搜索空间,MIP会使用随机森林来估计超参数的重要性,然后从下一次迭代中删除最小的参数。这样,MIP可以有效地修剪次要的超参数,从而将更多的计算资源分配给更重要的超参数,从而实现有效的探索。通过将BPE与增强学习,演化算法,随机搜索和可微体搜索在内的各种搜索算法相结合,与SOTA相比,我们可以将NAS的速度提高很多倍,而性能下降却可以忽略不计。

 

 

6.Projection & Probability-Driven Black-Box Attack

本文一作为厦门大学人工智能系2019级博士研究生李杰,通讯作者是其导师纪荣嵘教授。本文针对黑盒攻击场景需要大量查询次数的不足,提出了一种基于降维和概率驱动的黑盒攻击算法。本文的核心思路是先通过频率限制假设,将解空间转化为少数几个频率的振幅,减少解空间的大小。根据优化过程前后关联较大的观察,基于过去采样经验构建每次迭代采样的概率模型,加速优化。该算法在攻击成功率及查询次数上均优于传统方法,并在现实Google线上分类系统上得到验证。

 

 

7.Multi-task Collaborative Network for Joint Referring Expression Comprehension and Segmentation

本文一作为厦门大学人工智能系2018硕士研究生罗根,通讯作者是其导师纪荣嵘教授。本文提出了一种单阶段的多任务协同网络,用于同时进行指向性理解(Referring Expression Comprehension)以及指向性物体分割(Referring Expression Segmentation),并且解决了两个任务之间的预测分歧(prediction conflict)问题。本文的核心思想是在单阶段网络下使得两个任务在训练过程中能够互相优化和促进,同时我们设计了一种互能量最大化的方式在训练过程中解决预测分歧问题,同时提供了一种自适应的非极大值抑制的后处理方法来在推理过程中帮助两个任务达到一致的结果。实验结果在RefCOCO,RefCOCO+,RefCOCOg三个数据集上以及两个任务上都取得较大提升,同时我们的设计使得预测分歧大大下降。

 

 

8.Distill Image Dehazing with Heterogeneous Task Imitation

信息学院计算机科学系2017级博士研究生洪铭、华师大谢源教授是该论文共同第一作者,信息学院曲延云教授为该论文通讯作者。该论文提出一种基于知识蒸馏的图像去雾网络。该方法先使用干净图像训练一个自编码网络作为teacher网络;然后将去雾网络作为student网络,并使用teacher网络挖掘的干净图像的隐含特征和重建信息来指导有雾图像到干净图像的映射。在合成数据集和真实图像上的实验结果表明,所提出的方法优于当前流行的同类方法。

 

 

以上研究成果均以厦门大学为第一单位且通讯单位被计算机视觉与模式识别领域国际顶级会议CVPR2020接收

IEEE CVPR(IEEE Conference on Computer Vision and Pattern Recognition,即IEEE国际计算机视觉与模式识别会议)是由IEEE举办的计算机视觉和模式识别领域的顶级会议,是计算机视觉方向的三大顶级会议之一。目前在中国计算机学会(CCF)推荐国际学术会议的排名中,CVPR为人工智能领域的A类会议。CVPR2020于2020年2月24日公布接收结果,从6656篇有效投稿中接收了1470篇论文,接收率约为22%。在2019年最新版谷歌学术排行榜(该榜单从某种维度上反映了各大学术期刊和会议的影响力,以 h 指数作为评判标准)中,CVPR跃升全球所有期刊会议总排名前10位(Nature位列第一)。

此外,信息学院人工智能系纪荣嵘教授受邀担任CVPR 2021年的领域主席(Area Chair),显示了厦门大学在国际人工智能领域的影响力。


Top