首页 文章详情

CNN可视化又添新作,南大开源Group-CAM:高效的显著图生成方法|CVPR2021

极市平台 | 540 2021-05-29 19:08 0 0 0
UniSMS (合一短信)
↑ 点击蓝字 关注极市平台

作者丨孙裕道
审稿丨邓富城
编辑丨极市平台

极市导读

 

最近南京大学的一篇论文收录于CVPR2021,该论文提出了一种高效的Saliency Map生成方法,称为组分数加权类激活映射(Group-CAM)。 >>加入极市CV技术交流群,走在计算机视觉的最前沿

引言

当前解释深度卷积神经网络越来越引起了AI研究者的关注,因为它有助于理解深度神经网络的内部机制和做出特定决策的原因。在计算机视觉领域,可视化和理解深层网络最流行的方法之一是生成Saliency Map,突出与网络决策相关的显著区域。然而,现有方法生成的Saliency Map要么只反映网络预测的微小变化,要么计算显著图的计算过程的时间复杂度较高。最近南京大学的一篇论文收录于CVPR2021,该论文提出了一种高效的Saliency Map生成方法,称为组分数加权类激活映射(Group-CAM)。该论文作者提供了相应的代码,感兴趣的可以下载下来跑一跑。

论文链接:https://arxiv.org/abs/2103.13859
论文代码:https://github.com/wofmanaf/Group-CAM

Saliency Map介绍

在计算机视觉领域中,Saliency Map最先由Simonyan等人提出,它被用于图像分类模型的可视化。给定一个图像,类别,和类别预测分数函数,类别预测分数输入样本中像素点d的相关程度的计算公式可以表示为

Saliency Map的作用就是显示出样本中哪些特征对预测分数影响程度更大。

论文算法介绍

如下图所示为的模型流程图,首先用特征图和重要性权重的线性组合来提取激活。然后激活被分成组,并在去噪之前沿每个组中的通道维度求和,以生成初始掩模。输入图像按元素与相乘,然后用有意义的扰动进行变换。扰动的图像然后被馈送到网络。输出显著图可以被计算为所有的加权和,其中权重来自对应于各个扰动输入的目标类别的置信度得分。

初始化掩膜Masks

是一张输入图片,是深度神经网络,其中是输入图片在类中的预测分数。为了获得目标卷积层的类别区分初始组掩码,作者计算相对于第个特征图的梯度,这些梯度是高度和宽度维度上的全局平均值目的是为了获得神经元重要性权重:

其中表示的是特征图的像素点的数目。

假定是目标层特征图的通道个数,把所有的特征图和神经元重要性权重分成组。然后,每组中的初始掩码计算如下

其中,是每组特征图的个数。是特征图和梯度的组合,这意味着在视觉上可能有噪声,因为DNN的梯度由于ReLU中平坦的零梯度区域而趋于消失。所以不适合直接应用作为初始掩膜。为了解决这个问题,作者使用去噪函数来过滤,其中去噪函数可以表示为

与其将所有像素设置为二进制值,不如为激活图生成更平滑的Mask。作者通过利用最小最大归一化将的原始值缩放到中,

用双线性插值对进行上采样,达到相同的分辨率,以屏蔽输入。

Saliency Map生成

作者使用模糊信息替换未保留的区域(0值的像素),然后对该图像执行分类以测量初始屏蔽的重要性。模糊图像可以通过以下方式计算

其中,是与形状相同的图像。

保留区域的贡献值的计算公式为:

最终的Saliency Map是具有权重的初始掩模的线性组合,其计算公式为:

根据上述原理所述,Group-CAM的算法流程图重新整理成如下形式:

实验结果

作者定性地比较的方法包括基于梯度的方法如引导反向传播,

基于区域的方法如,和基于激活的方法如,以验证的有效性。


如下图所示,正确地给出了“类别的解释位置,结果表明,比基于区域的方法和基于激活的方法更有说服力,并且比基于梯度的方法包含更少的噪声。

作者通过进行删除和插入测试,以评估不同的Saliency Map方法。删除度量背后的直觉是,删除与类别最相关的像素/区域将导致分类分数显著下降。另一方面,插入度量从模糊的图像开始,逐渐重新引入内容,这产生了更真实的图像。如下图所示,根据删除和插入曲线为代表性图像生成Saliency Map。在插入曲线中,更好的解释是预计预测得分快速增加,而在删除曲线中,预计分类置信度下降更快。可以发现表现的更出色。

在ImageNet-1k上运行时间方面的比较评估中可以发现的平均运行时间都很少。

定位精度的计算公式可以表示为:

如果最显著的像素位于对象的带注释的边界框内,则被视为命中。从下表可知,的平均精度要高于其它的方法。

下图是微调后的ResNet-50生成的Saliency Map可视化。随着ResNet-50性能的提高,由生成的Saliency Map的噪声降低,并更多地关注重要区域。



本文亮点总结


1.在计算机视觉领域中,Saliency Map最先由Simonyan等人提出,它被用于图像分类模型的可视化。Saliency Map的作用就是显示出样本中哪些特征对预测分数影响程度更大。

如果觉得有用,就请分享到朋友圈吧!

△点击卡片关注极市平台,获取最新CV干货

公众号后台回复“目标检测竞赛”获取目标检测竞赛经验资源~


极市干货
YOLO教程:一文读懂YOLO V5 与 YOLO V4大盘点|YOLO 系目标检测算法总览全面解析YOLO V4网络结构
实操教程:PyTorch vs LibTorch:网络推理速度谁更快?只用两行代码,我让Transformer推理加速了50倍PyTorch AutoGrad C++层实现
算法技巧(trick):深度学习训练tricks总结(有实验支撑)深度强化学习调参Tricks合集长尾识别中的Tricks汇总(AAAI2021
最新CV竞赛:2021 高通人工智能应用创新大赛CVPR 2021 | Short-video Face Parsing Challenge3D人体目标检测与行为分析竞赛开赛,奖池7万+,数据集达16671张!


极市原创作者激励计划 #


极市平台深耕CV开发者领域近5年,拥有一大批优质CV开发者受众,覆盖微信、知乎、B站、微博等多个渠道。通过极市平台,您的文章的观点和看法能分享至更多CV开发者,既能体现文章的价值,又能让文章在视觉圈内得到更大程度上的推广。

对于优质内容开发者,极市可推荐至国内优秀出版社合作出书,同时为开发者引荐行业大牛,组织个人分享交流会,推荐名企就业机会,打造个人品牌 IP。

投稿须知:
1.作者保证投稿作品为自己的原创作品。
2.极市平台尊重原作者署名权,并支付相应稿费。文章发布后,版权仍属于原作者。
3.原作者可以将文章发在其他平台的个人账号,但需要在文章顶部标明首发于极市平台

投稿方式:
添加小编微信Fengcall(微信号:fengcall19),备注:姓名-投稿
△长按添加极市平台小编


觉得有用麻烦给个在看啦~  
good-icon 0
favorite-icon 0
收藏
回复数量: 0
    暂无评论~~
    Ctrl+Enter