基于深度学习的图像识别与分类系统文献综述

 2022-08-09 19:48:51

一、文献综述

(一)国内外研究现状

深度学习是机器学习和人工智能研究的最新趋势之一,也是当今最流行的科学研究趋势之一。深度学习方法为计算机视觉和机器学习带来了革命性的进步。新的深度学习技术正在不断诞生,超越最先进的机器学习甚至是现有的深度学习技术。近年来,全世界在这一领域取得了许多重大突破。由于深度学习的快度发展,导致了它的进展很难被跟进,特别是对于新的研究者。

图像识别是计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对像的技术。识别过程包括图像预处理、图像分割、特征提取和判断匹配。简单来说,图像识别就是计算机如何像人一样读懂图片的内容。借助图像识别技术,我们不仅可以通过图片搜索更快的获取信息,还可以产生一种新的与外部世界交互的方式,甚至会让外部世界更加智能的运行。图像识别技术的研究目标是根据观测到的图像,对其中的物体分辨其类别,做出有意义的判断。即利用现代信息处理与计算技术来模拟和完成人类的认识、理解过程。一般而言,一个图像识别系统主要由三个部分组成,分别是图像分割,图像特征提取以及分类器的识别分类。其中,图像分割将图像划分为多个有意义的区域,然后将每个区域的图像进行特征提取,最后分类器根据提取的图像特征对图像进行相应的分类。实际上,图像识别和图像分割并不存在严格的界限。从某种意义上,图像分割的过程就是图像识别的过程。图像分割着重于对象和背景的关系,研究的是对象在特定背景下所表现出来的整体属性,而图像识别则着重于对象本身的属性。图像识别技术在航空航天、医学、通信、工业自动化、机器人、及军事等领域均有着广泛的应用。

图像识别的发展经历了三个阶段:文字识别、数字图像处理与识别、物体识别。文字识别的研究是从1950年开始的,一般是识别字母、数字和符号,从印刷文字识别到手写文字识别,应用非常广泛,并且已经研制了许多专用设各。数字图像处理和识别的研究开始于1965年。数字图像与模拟图像相比具有存储,传输方便可压缩、传输过程中不易失真、处理方便等巨大优势,这些都为图像识别技术的发展提供了强大的动力。物体的识别主要指的是对三维世界的客体及环境的感知和认识,属于高级的计算机视觉范畴。它是以数字图像处理与识别为基础的结合人工智能、系统学等学科的研究方向,其研究成果被广泛应用在各种工业及探测机器人上。

(二)研究主要成果

(1)基于分类的卷积神经网络目标检测

传统目标检测方法包含预处理、窗口滑动、特征提取、特征选择、特征分类、后处理等步骤,而卷积神经网络本身具有特征提取、特征选择和特征分类的功能。那么,可以直接利用卷积神经网络对每个滑动窗口产生的候选区进行二分类,判断其是否为待检测目标。相比于传统目标检测的六个步骤,基于分类的卷积神经网络目标检测只有: 窗口滑动,产生候选区域(region proposals),对候选区域图像分类,后处理三个步骤,而且窗口滑动和后处理都是固定的方法。因此,该类方法的研究重点在于如何提升卷积神经网络的特征提取能力、特征选择能力以及特征分类能力,以提高图像识别的准确度。这类算法的典型代表是基于region proposal的R-CNN系算法,如R-CNN,Fast R-CNN,Faster R-CNN等。

相较于传统的滑动卷积窗口来判断目标的可能区域,R-CNN采用selective search的方法来预先提取一些较可能是目标物体的候选区域,速度大大提升,计算成本也显著缩小。总体而言,R-CNN方法分为四个步骤:生成候选区域、对候选区域使用CNN进行特征提取、将提取的特征送入SVM分类器、最后使用回归器对目标位置进行修正。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。