- 文献综述(或调研报告):
国外研究现状
近来,随着视频分析的硬件的发展(包括视频获取设备如摄像头,图像采集卡,处理器和计算机等),基于视频信息的分析迅速渗透到人民生活的各个方面。巨大的商业价值和应用价值使越来越多的公司和学术机构致力于这种技术的研究。美国,英国等国家己经展开了大量相关项目的研究。1997年,由美国国防高级研究项目署DARPA(DefenceAdvanced Research Projects Agency)领头,以美国卡耐基梅隆大学为首,麻省理工学院等高校参与了视频监控系统项目VSAM(VSAM:System for video surveillance andmonitoring,意为:视频监控系统)的研究开发,并于2000年基本完成.此项目主要研究的是针对战场及普通民用场景进行监控的自动视频理解技术:分布于各个不同位置的摄像头获取的视频信号通过一个分布式的网络连接汇集到操作中心,只需要一个操作人员就可以监控一个相当广阔的空间范卧.同时,在很大程度上减少了操作人员的劳动强度,系统能够自主检测异常情况的发生,而且只有在检测到异常的情况下系统才会发出信号,提醒操作人员作相应的处理。911事件以后,机场、银行、政府部门等重要安全场所的监控再次成为人们所关注的焦点,受到了各国安全部门和研究机构的重视,很多大学和研究所都投入了相关的研究:Wren等人研究的Pfinder系统是一个利用颜色和形状特征对大视角范围内的人进行跟踪的实时系统;Olson等人介绍了一种更通用的运动物体检测和事件识别系统,它通过检测帧间变化来发现运动物体,在跟踪中上使用了一阶预测和最近邻匹配技术;Haritaoglu等人的W4系统是一个可以在室外对人进行实时检测和跟踪的视觉监视系统刀,它将外形分析与跟踪技术相结合来跟踪人体各个部分的位置并为人的外形建立模型;美国CMU和Samoff公司合作研究的“实时视频中运动目标识别分类与跟踪系统rsquo;rsquo;(Moving Target Classification and Tracking from Real—time Video),可以对视频中的目标实时监控及跟踪,它使用多个相互协作的摄像机在复杂环境里对人和车进行连续的跟踪,并对目标类别和行为进行分析,英国的雷丁大学(University ofReading)已开展了对车辆和行人的跟踪及其交互作用识别的相关研究。
国内研究现状
相对而言,国内在目标跟踪技术方面的研究起步较晚。主要的研究团队有中科院自动化所模式识别国家重点实验室、北京大学视觉与听觉信息处理国家重点实验室及清华大学智能技术与系统国家重点实验室。中科院自动化所模式识别国家重点实验室的主要目标是实现一个动态场景集成分析演示系统并最终推向实用,而北京大学视觉与听觉信息处理国家重点实验室的工作主要是实现高度智能化的机器感知系统,并在言语听觉技术、三维视觉信息处理、智能机器人等研究领域取得许多研究成果。清华大学智能技术与系统国家重点实验室主要从事人工智能基本原理、基本方法的基础与应用基础研究,包括智能信息处理、机器学习、智能控制,以及神经网络理论等,还从事与人工智能有关的应用技术与系统集成技术的研究,主要有智能机器人、声音、图形、图像、文字及语言处理等。
运用和背景的差集来追踪目标或是人体无论是在室内或者室外环境中都是非常普遍的。但是这个方法可能由于照明条件的变化,阴影和室内室外环境中的吸收不回取得很高质量的结果。Song和Nevatia 建议了一种在室内环境中通过Adaboost算法(通过迭代弱分类器而产生最终的强分类器的算法)的人脸探测和Camshift算法(连续自适应期望连续算法)进行颜色的追踪来对于人脸和人体同时追踪的方法。光照条件的变化并没有被考虑在内。在这个研究中,一种很聪明的方法被推荐,那就是用皮肤的反射率值来追踪在复杂光照条件的室内、室外环境的实时视频。在实验中发现,当视频从一个室内视频会议变换到被认为光照条件经常变化的现场新闻直播也有很好的效果。
在复杂的条件下追踪人体或者区分两个很相似的互相作用着的人是一个很有挑战性的任务。对于每个独立于那些容易辨别、预知和定位的个体存在着一些独一无二的特性。预知人体运用的独特的特性已经变成了一个公认的技术。在复杂的光照条件下运用脸部特性来追踪人体仍然是一个有挑战性的任务而且它在计算机视觉中扮演着重要的角色。在像视频会议和现场新闻直播中的应用通常都需要一个很好的技术去再变化光照条件下追踪人体。
这种追踪可以通过提取视频片段中的图片画面来完成。要想在静态的情景中区分出运动中的物体背景的差集是一个常见的技术。但是存在着一个问题就是在室外环境中因为光照条件的变化通常是由太阳光影响。在室内环境中,灯光的变化和反射可能会发生的很快导致和人体在背景差集后一样的光斑的变化。由于人体与摄像机的距离,当人出现在室内、室外视频中时会变的更加复杂。如果光照条件的变化跟这个同时在环境中出现将会增大追踪的难度。
在侦查过程中通过图片识别人体脸部特征时,光照条件的变化将会成为一个最主要的问题。这种变化使得在同一视频中的图片中的各个画面产生不同级别的强度差异。一个物体表面发出的光是由于光源、阴影和内在反射在光谱强度分布中的位置产生的。在同样的图片种用不同的视角会因为光照条件的变化会在探测人脸时产生一个巨大的威胁。最近,实时人脸检测在国土安全中的人体识别中变得更为重要。脸部的检测方法通用模型通过在一个脸部特征周围本地纹理像眼睛、鼻子或者嘴角周围的像素,然后找到在这些特征周围的几何结构。
一个多导向、多规模的Gaussian导数被Burl等人提出用来建立人脸关键点周围的纹理模型。Dryden和Mardia建议物体识别技术仅用shape information。当比较2个可能的特征点结构时,最好的办法是通过结合多种特征特性来发觉。Wiskott等人运用Gabos Jet探测器和通过图表结构来模仿脸部特征的分布。在模型中,合适函数的质量是基于Gabos Jet探测器的反馈和与内部特征相似的距离的总和。在这里,形状和特征的探测是混合在一种专门的方式下通过手动的调整过的测量计划。Feris等人用一个Gabor微博网络上的双阶段层级来仅仅模仿脸部的图像结构。从第一层提取的整个脸部的近似的预估值是用来在第二层中引导特征的探查。有一些其他的方法,仅仅用面部特征探查技术来做脸部的识别。Cootes等人提出将形状和纹理模型混合在AAM中来进行脸部识别。特征探测器的性能可以通过使用全球形状约束来显著的提高。
色彩追踪对于由照明的变换,阴影,吸收和目标出现的变化造成的问题是有抵抗性的。Song和Nevatia建议了一种联立的脸部和身体追踪对于室内环境中的人体检测运用Adaboost脸部检测和Camshift颜色追踪的方法。照明的变化在他们的工作中并没有被考虑。在研究中,一种智能的用于色彩追踪的组合方法运用皮肤反射值来追踪人在室内室外变化的照明环境实时视频中被提出。这个研究发现在由室内视频会议环境或是室外照明条件经常变换的实时新闻播报环境中都有很好的效果。
以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。