基于CNN的道路交通标志检测识别算法设计与验证文献综述

 2022-09-23 16:18:38

  1. 文献综述(或调研报告):

交通标志的检测与识别算法一直是智能辅助驾驶领域的研究热点,目前已有许多有效的算法被提出。较早的解决方案是利用交通标志的颜色和形状等作为典型特征进行识别。然而这些方法都有较大的局限性。基于颜色特征的方法利用交通标志通常是红黄蓝三种颜色进行标志的检测,然而这些方法对光照条件极为敏感。尽管文献[1][2]中提到一些颜色空间如sRGB,HSV等可以减少对光照的敏感,但依然需要根据光照条件手动设置阈值。基于形状特征的方法检测圆形、三角形和矩形等交通标志具有的形状,这些方法通常需要提取图像中的边缘特征,霍夫变换是常用的一种算法[3]。然而这种方法通常计算量较大,同时难以处理真实环境中普遍存在的遮挡、模糊等丢失边缘形状的情况。有一些研究工作试图将这两种方法结合[4,5],但依然存在诸多问题,识别率难以提高。为了找到稳定的图像特征描述子,许多学者提出了诸多方法。 Dalal等人在2005年提出了HOG(Histogram of Oriented Gridients)特征法[6],这种方法利用一个窗口在图像上滑动得到局部区域的梯度方向直方图构成特征,避免了光照,形变对图像特征的影响,取得了较好的识别结果。然而,由于滑动窗口需要对整张图像进行多次彻底的扫描,因此非常耗时,而且会得到相当数量的候选区。

随着对目标识别研究的深入和数据集的建立,基于学习的方法开始显现其巨大的优势。常见的算法如最近邻法[7],支持向量机[8],人工神经网络[9]等。这些算法能够利用数据集巨大的样本容量,从中自动学习合适的特征以及参数,因此在识别的准确率上远远超过基于颜色和形状的方法。近些年,深度学习研究不断深入,计算机硬件水平不断提高,卷积神经网络(CNN)在图像处理领域得到了广泛应用,极大的提高了目标识别的准确率和速度。

卷积神经网络(CNN)是人工神经网络的一种,与一般的神经网络相同,卷积神经网络接受一系列输入数据,经过网络中隐藏参数计算后,输出一系列计算结果。卷积神经网络由于局部连接和权值共享的特点,极大的减少了参数数量,使得神经网络在处理大型图像上具有了可行性。卷积神经网络一般具有卷积层,降采样层,detection层等,有些网络加入了BN(Batch Normalization)层加速网络收敛。网络的每一层接收上一层的数据作为输入,和当前层的参数进行点乘计算,然后通过一个激活函数,得到计算结果。

卷积层:卷积神经网络的核心,用于提取图像特征,完成网络中大部分的计算工作。每一层包含一系列的卷积核对当前输入的特征卷进行从上到下,从左到右的扫描,扫描到的位置对应的输入和卷积核进行点乘,激活操作,得到一个激活值,卷积核在移动过程中产生的一系列激活值组成特征卷,这些特征卷代表了这一系列卷积核选择出的图像特征。

可以看出,卷积层利用卷积核对特征卷进行操作,意味着神经网络中的每个神经元只连接输入的局部区域,这个区域成为神经元的感受野。另外,特征卷中每一层特征是由同一个卷积核得出的,这是基于一个合理的假设:特征的平移不变性。局部连接和权值共享的特点使得卷积层的参数数量大大减少,提高了网络的收敛速度。

降采样层:在卷积神经网络设计中,通常会在某些卷积层之间加入降采样层。其目的是减小网络中的参数和计算量,控制过拟合。常见的一种策略是将输入的特征卷中一块mtimes;m的区域中的最大值作为该区域的输出值。这种做法被称作最大池化。还有平均池化,即取该区域中所有数值的平均值作为输出值。

detection层:输入图像在经过卷积层和降采样层后,得到一系列特征卷,detection层对这些特征卷进行最后一步处理,得到图像中存在目标的类别和位置。在预测周期中,detection层对目标的标签和边界框进行回归预测。在训练周期中,detection层通常使用回归损失函数,网络的总损失为标签预测和边界框预测两种损失之和。神经网络训练的目的是调整神经网络参数,使得损失降到最小,达到全局最优。

BN层:全称Batch Normalization,是google于2015年提出的一种模型正规化方法,目的是实现网络的加速收敛[10]。在网络训练的过程中,即使是很小的权值变化,随着网络层数的加深会被逐步放大,可能使得数据分布逐渐向非线性激活函数的上下端靠近,导致反向传播时梯度逐渐消失,进而造成收敛速度变慢。另外,通过Batch Normalization,可以使网络的每一层训练和样本的分布转化为标准正态分布,使得每一批训练样本的分布类似,加速网络收敛速度。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。