比思論壇

標題: 图像分割出新方法 [ [打印本頁]

作者: 深蓝色的畅想 時間: 2022-8-5 22:04
標題: 图像分割出新方法 [

华中科技大学硕士生黄钊金作为第一作者完成研究成果Mask Scoring R-CNN，在COCO图像实例分割任务上超越了何恺明（首获CVPR“最佳论文奖”的中国学者）的Mask R-CNN，拿下了计算机视觉顶会CVPR 2019的口头报告。该成果从5000多篇投稿中脱颖而出，成为最顶尖的5.6%。

黄钊金师从华中科技大学电信学院副教授王兴刚，王兴刚也是这篇论文的作者之一。目前，相关算法已经开源。

什么是Mask R-CNN？它其实是一种简洁、灵活的实例分割框架。2017年，计算机研究者何恺明凭借Mask R-CNN的研究成果拿下ICCV 2017最佳论文奖。

与何恺明的研究成果相比，黄钊金的Mask Scoring R-CNN在性能上有什么优越性呢？在论文中，研究人员提出了一种给算法的“实例分割假设”打分的新方法。这个分数打得是否准确，会影响实例分割模型的性能。

这些模型在实例分割任务里，虽然输出结果是一个蒙版，但打分却是和边界框目标检测共享的，都是针对目标区域分类置信度算出来的分数。这个分数和图像分割蒙版的质量未必一致，用来评价蒙版的质量，可能就会出偏差。

于是，这篇CVPR 2019论文就提出了一种新的打分方法——给蒙版打分，被称之为蒙版得分（Mask Score）。

Mask Scoring R-CNN中提出的计分方式很简单：不仅仅直接依靠检测得到的分类算分，而且还让模型单独学一个针对蒙版的得分规则：MaskIoU head。

MaskIoU head是在经典评估指标AP（平均正确率）启发下得到的，会拿预测蒙版与物体特征进行对比。MaskIoU head同时接收蒙版head的输出与ROI的特征（Region of Interest）作为输入，用一种简单的回归损失进行训练。

最后，同时考虑分类得分与蒙版的质量得分，就可以评估算法质量了。评测方法公平公正，实例分割模型性能自然也上去了。

实验证明，在挑战COCO benchmark时，在用MS R-CNN的蒙版得分评估时，在不同基干网路上，AP始终提升近1.5%。

在COCO 2017测试集（Test-Dev set）显示的成绩对比中，无论基干网络是纯粹的ResNet-101，还是用了DCN、FPN、MS R-CNN的AP成绩都比Mask R-CNN高出一点几个百分点。在COCO 2017验证集上，MS R-CNN的得分也优于Mask R-CNN。

歡迎光臨比思論壇 (http://bb-cc.site/)