弃用不适用的分类器1。另一种类似的传统方法是利用定向梯度HistogramofOrie
tedGradie
tsHOG特征和支持向量机SupportVectorMachi
eSVM进行分类。方向梯度直方图(HistogramofOrie
tedGradie
tHOG)特征是一种在计算机视觉和图像处理中用来进行物体检测的特征描述子。它通过计算和统计图像局部区域的梯度方向直方图来构成特征。Hog特征结合SVM分类器已经被广泛应用于图像识别中,尤其在行人检测中获得了极大的成功。需要提醒的是,HOGSVM进行行人检测的方法是法国研究人员Dalal在2005的CVPR上提出的,而如今虽然有很多行人检测算法不断提出,但基本都是以HOGSVM的思路为主,它仍然采用多尺度滑动窗口,和ViolaJo
es框架相比,虽然这个方法表现更佳,但速度要慢得多2。22深度学习方法221OverFeat2第一个目标检测的深度学习方法是2013年纽约大学发表的OverFeat。他们提出了一种使用卷积神经网络的多尺度滑动窗口算法,用于目标的分类,定位和检测。并且还发明了一种新的基于边缘检测的定位目标位置的算法。222RCNNRegio
swithCNNfeatures基于卷积神经网络特征的区域方法5加州大学伯克利分校UCBerkeley提出的RCNN提高了对象检测50,一个三阶段的方法:不同区域提出不同的提案,然后提取可能的对象(最常用的是选择性搜索算法);用CNN从区域提取特征;用SVM对区域进行分类。
图1
RCNN架构
虽然它取得了很大的成绩,但训练RCNN有很多问题。你必须为训练数据生成提案,再将CNN的特征提取应用到每一个区域,最后训练SVM分类器。223快速RCNNFastRCNN6RCNN很快就彻底升级成深度学习方法。一年后,RossGirshick(现在在微软)发表了快速RCNN。和RCNN相似,它使用选择性搜索生成对象的提案。
f但是与RCNN不同的是,RCNN独立地提取各区域的所有特征,然后使用SVM分类器;FastRCNN在整个图片上使用CNN,然后对特征映射使用“兴趣区域”Regio
ofI
terestRoI池化,最后使用前馈网络进行分类和回归。这种方法不仅速度更快,而且具有RoI池化层和全连接层,这使模型具有端到端的可微性并且更容易训练。FastRCNN最大的缺点是,模型仍然依赖于选择性搜索(或其他区域方案算法),这使推断成为了它的瓶颈。
图2
FastRCNN架构
224更快的RCNNFasterRCNN7随后RCNN系列迎来了第三次迭代:更快的RCNN。它添加了区域提案网络Regio
ProposalNetworkRPN,摆脱了选择性搜索算法,并可以做到端到端的训练。RPNs的任务是基于object
ess分数输出对象,然后用RoI池化RoIPooli
gr