文献综述(或调研报告):
计算机视觉是通过各种视频采集设备来替代人眼器官作为输入信号来源,由计算机视觉系统代替人脑完成对视频流的处理和分析。计算机视觉研究的最终目标是让计算机能够像人一样通过视觉系统实现对周边世界的观察和理解,并具有自主适应环境变化的能力。假定使用摄像机作为计算机的视觉传感器,其基本原理工作步骤为对监测或控制的对象进行图像采集,并转化成视频信号;再对视频信号进行低通滤波处理,转变成模拟信号,并在时间上连续;再用A/D转换器将模拟信号转变成数字信号,并对数字信号进行量化编码;输入计算机,由计算机中的视觉软件系统进行处理,并把处理结果输出,最终达到对目标进行监控的目的[1]。
机器人视觉是通过计算机使得机器人具有人的视觉功能,其基本工作原理与计算机视觉类似,主要研究使用计算机模拟人眼的视觉感知能力,通过从输入视频图像中提取有用特征信息,进行目标特征建模,再进行目标识别处理和分析,让机器人能够识别出场景中的目标物体,并能够确定目标物体所在的位置和大小[1]。
机器人视觉系统已经被提出多年,根据其发展历史,大体上可以将其分为三代:第一代系统主要由数字电路组成,系统按照事先制定好的流程,对视频流图像帧进行处理,并将处理结果进行输出,该系统主要被应用于材料的缺陷检测;第二代系统主要由计算机、图像采集输入设备和处理结果输出设备组成,并且已经具有一定的自适应环境能力;第三代系统是近年来正在研究开发的视觉系统,具有很高的智能性和环境自适应能力,并能在一定程度上模拟人眼视觉感知的能力[1]。
对图像进行预处理操作主要是为了能够在得到图像之后进行相关改进并且去除图像噪声。由于进行实际应用时,必然有很多因素会干扰到系统的运行。比如光线强弱的影响、检测元件本身出现性能改变等,这些干扰都会使得图像质量有所下降。系统受到影响后也会导致系统在对运动人体进行检测与跟踪的效果受到影响。为了能够最大限度的减少这种外界干扰带来的影响,需要使用一些有效的解决方法。根据干扰因素产生的原因以及自身的特性,能够采取的解决方法有,把图像处理成高精度、高质量、包含有效信息的图像后,再继续进行后续检测跟踪环节。对图像进行预处理是对图像进行优化的环节[2]。
人体目标识别与跟踪是家庭服务机器人中常用的一项基本技术,针对运动目标的检测,由于运动目标在复杂动态场景中容易受到外界条件的影响,如目标的运动速度、姿态以及光照条件的变化。所以在这些复杂动态场景中给运动目标检测与跟踪的研究带来了极大的挑战。目标检测是指从视频流中实时提取运动目标,将运动目标从复杂的背景中提取出来,滤除图像中与运动目标无关的信息[3]。
运动人体检测的过程如下:根据视频序列提供的信息把运动人体取出来,在此之前,首先对区域进行分割取出运动区域,运动区域提取出来后,需要依据灰度、纹理以及边缘等信息然后通过灰度、纹理和边缘等信息对运动目标进行分类,从而能够取出运动人体。运动人体检测环节难度比较大,因为,在这个环节中,会受到外界环境的很多干扰,比如:光线强弱、相似目标的干扰等。对于一些不依赖先验知识的运动目标跟踪算法来讲,运动人体检测是实现运动目标跟踪的第一步 [2]。目前常用的运动目标检测算法包括:光流法、帧间差分法、背景减除法以及分类器的方法等。这些众多的运动目标检测方法各自具备特定的优缺点,如何能够快速准确地提取出监控场景中的前景目标是其最重要的任务与目的[4]。
所谓目标跟踪指对图像中的目标进行检测、提取、识别和跟踪,获得目标的运动参数,如速度、位置、运动轨迹以及加速度等,从而进行进一步分析和处理,获得运动目标的参数,以完成更高一级的处理[2]。运动目标的提取与跟踪,是智能移动机器人需要完成的主要任务之一,目前的研究分为基于视频的跟踪和基于场景的跟踪两种,前者主要用于视频监控等领域,首先在图像中提取目标特征,通过特征匹配确定目标位置,最终得到目标轨迹;后者多用于移动机器人领域,通过对场景进行建模,判断目标与机器人实际位置偏差,然后采取某种策略趋近目标[5]。
一般来讲,视频目标跟踪的流程主要分为四个部分:目标初始化、目标模板建模、目标定位、目标模板更新。跟踪一般分两种思路。若模板建模较准确即确定性的表观模型,此类跟踪问题,采用精确匹配模板的方式就可以解决。例如混合高斯模型等方法。但在大多数情况下,因实际的目标模板建模比较复杂并且呈现非线性,较难用准确的数学模型述,故可把提取的特征(颜色、角点、纹理、边缘)转化为判别特征是属于目标还是背景的分类问题,即基于分类器的表观模型[6]。根据跟踪目标的表达方法和相似性度量方法的不同,通常将目标算法分为五类:基于主动轮廓线的跟踪、基于特征的跟踪、基于区域的跟踪、基于模型的跟踪和基于运动特征性的跟踪。跟踪算法的优劣体现在:算法的鲁棒性、准确性和实时性等方面,而算法的鲁棒性和准确度基本取决于运动目标的关注点和相似性度量的界定,跟踪算法的实时性取决于滤波预测算法和匹配搜索策略[7]。
智能视频监控系统的核心基础是目标检测与目标跟踪技术,只有在完成目标的检测与跟踪后,才能进行高级层次的语义分析以及行为判断。为此,针对某一使用环境或者特定的研究对象,国内外研究者出了大量的有价值的、实用的、稳定较好的跟踪算法。特别是工程方面的需求突显以及计算机视觉理论的发展,目标跟踪领域仍然是计算机视觉研究的重点。国际上一些知名杂志以及顶级会议如:PAMI、CVPR、ICCV等;这些杂志与会议录用了最新的关于目标跟踪领域的学术文章,为研究者们提供了一个广阔的学习平台。实际应用层面,例如IBM 公司同马里兰大学联合研发的 W4(what,where,when,who)系统,该系统不仅仅是对单人的目标检测和跟踪,还能完成多人跟踪的任务,还能进行对人与人间的交流与沟通作简单的理解。IBM还与微软等公司合作,把基于视觉手势识别的接口用于商业领域。在国内,虽然理论与实际应用起步都较晚,但仍有大批学者为此做出努力。例如中国科学院模式识别实验室在人体行为分析、交通行为分析、视频监控等方面做了大量研究,取得了许多有价值的理论和应用成果[8]。
以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。