文献综述(或调研报告):
1目标检测算法研究现状
1.1传统目标检测算法
基于图像的目标检测是计算机视觉的一个研究分支。传统的目标检测算法一般有三个步骤:首先是使用不同尺度的滑动窗口选定图像中的某一区域作为候选区域,然后从候选区域中提取Harr、HOG、LBP等一类或多类特征,最后使用Adaboost或SVM等分类器对候选区域进行分类,判断是否属于待检测的目标。其中每个步骤的效果都会影响最终的目标检测效果。
1.2基于深度学习的目标检测算法
2012年,以AlexNet[1]模型为代表的深度卷积神经网络(Convolutional Neural Networks,CNN)的出现标志着深度学习进入了一个新的发展阶段。而随着R-CNN[2]算法的提出,基于深度学习的目标检测算法取得了长足进步。R-CNN将候选区域(Region Proposals)和CNN结合在一起,得到基于候选框的卷积神经网络。R-CNN对于输入的图像,通过选择性搜索(Selective Search)等方法,提取出包含目标的候选区域,将CNN应用于候选区域,以定位所检测的目标。因为R-CNN对每一个候选框提取特征,所以该算法需要耗费大量时间。
R-CNN之后,SPP-Net[3]使用空间金字塔池化策略(Spatial Pyramid Pooling),消除了原有CNN网络由于输入固定尺寸图像,而降低对图像识别精度的问题。该方法避免了卷积特征的重复计算,而且对任意大小和比例的图像都有较好的鲁棒性。在目标检测中,SPP-Net可以保证和R-CNN拥有同样检测精度的前提下,检测效率更高。在Pascal VOC 2007和Caltech101 数据集上,SPP-Net都展示出较好的检测能力。
Fast R-CNN[4]汲取了R-CNN和SPP-Net的优点,并借鉴了多任务损失函数的思想,使整个网络在训练和测试时变得更加方便快捷。在Pascal VOC 2012数据集上,Fast R-CNN实现了更高的检测精度。与R-CNN和SPP-Net相比,Fast R-CNN速度更快,检测结果更准确。
Faster R-CNN[5]提出RPN(Region Proposal Network)替代选择性搜索方法,以筛选图像中可能存在目标的感兴趣区域,并引入了锚点(Anchors)的思想生成候选框,实现了端到端(end-to-end)的目标检测。Faster R-CNN采用VGG16网络框架的卷积部分进行特征提取,并训练一个目标分类(Classification)和位置精修(Box Regression)网络,对RPN网络筛选出的候选框区域进行详细的目标分类和位置精修。在Pascal VOC 2007、Pascal VOC 2012和MS COCO数据集上的测试显示,Faster R-CNN拥有更好的检测效果。
以上所述检测算法的网络模型均可以分为特征提取和目标检测两个阶段。而YOLO[6]属于单阶段检测算法,无需生成特征候选区域。YOLO将目标检测定义为空间分离的边界框和相关概率的回归问题,用单个神经网络从完整图像中预测边界框和相关概率,可以直接根据检测性能进行端到端的优化。YOLO算法的计算实时性能非常好,检测速度大幅度超过R-CNN等算法。但也正是由于YOLO算法使用整张图像的特征回归,使得目标定位误差较大一些。
以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。