基于弱监督的脑部肿瘤分割研究文献综述

 2023-08-07 05:08

文献综述(或调研报告):

  1. 经典分割模型

卷积神经网络(Convolutional Neural Networks,简称CNN)是一种强大的计算机视觉模型,它非常擅长从图像中提取特征,并最终给出对于整个图像的预测结果。然而,如果我们想要获得像素级的分类结果,也就是我们所说的语义分割,经典的卷积网络显然是不够的。

2015年,全卷积神经网络[1](Fully Convolutional Networks,简称FCN)的提出为语义分割的发展做出了巨大贡献。经典的卷积神经网络由输入层、若干隐藏层和输出层组成,其中每一层隐藏层又由卷积层、激活函数和池化层组成。而FCN与CNN的区别主要在于输出层,FCN用反卷积层替换了CNN中的全连接层,对特征提取的结果进行上采样,最后得到一个与原图尺寸相同的输出,从而实现了像素级的分割。

在FCN的基础上,又出现了很多用于语义分割的神经网络,U-Net[2]就是一种适用于生物医学图像分割的神经网络。与FCN不同,U-Net采用了完全对称的下采样和上采样结构,而不是像FCN一样在最后输出前才进行上采样。实验表明,U-Net在生物医学领域,如细胞电子显微镜图像分割等问题上有着较为出色的表现。

上述两种网络的结构基本上继承了经典的卷积神经网络,还有一些分割网络的设计思路相对要特别一些,比如Kaiming He在2017年提出来的Mask R-CNN[3]则在卷积神经网络的基础上做了更大的改动。同样是采用卷积网络进行特征提取,Mask R-CNN接下来使用了区域建议网络通过滑动窗口寻找目标模型,找到一个再对目标矩形进行更精细地裁剪。不过Mask R-CNN更适合去做一些instance-level的检测,如果需要分割的物体尺寸过小,可能会达不到预期的效果。

  1. 基于弱监督的语义分割

基于上述分割网络,我们可以得出语义分割问题的本质是用卷积网络提取图像中的特征,再通过对特征的处理获得分割结果。但当我们使用弱监督的标签进行训练的时候,我们则需要对我们现有的算法进行调整,把更多的注意力放在图像本身的特征上。

Alexander等人在[4]中提出了弱监督语义分割的三个原则:seed,expand和constrain。Seed指通过特征提取获得物体在图像中的大致位置、expand指从大致位置出发根据图像的全局信息去拓展、constrain是指根据物体的边界去限制上一步的拓展。根据以上三个原则,这篇文章提出了三个残差函数(loss function),通过实验验证,这些残差函数在弱监督分割问题中起得了积极的作用。

类似的还有[5]中提到的方法,它首先利用图像级的标签训练一个分类网络,为待分割的目标寻找一个大致的位置,这一步结束后生成像素级的标签,并将当前的标签放入弱监督网络再次学习,最后,利用区域增长的算法完善前两步的学习成果。以上两种方法都利用了先定位后增长的分割思路。

[6]中就图像级标签语义分割问题提出了一些更为直接的思路。这篇文章提出了一个从简单到复杂的学习框架,首先不适用标签对原始的图像进行无监督特征提取,得到一个最原始的分割结果;然后,将第一步的分割结果与全局标签融合,放进一个增强的神经网络进行第二次学习;最后,把第二次学习的结果再次与图像级标签融合,使用更强的神经网络进行训练,得到最终的预测结果。

还有一些弱监督的分割算法,并不是基于图像级的标签,而是基于bouding_box的弱监督标签。Bounding_box的标签完成了大致图像定位的工作,剩下的则需要对目标框内的物体进行更细致的分割。[7]和[8]中都提出了对Bouding_box标注数据进行分割的模型,并且取得了非常接近完全监督的训练成果。不过,由于我们需要处理的肿瘤形状较为不规则,暂时不考虑基于Bounding_box的弱监督算法。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。