文献综述(或调研报告):
最近的几年来,无人机技术得到了非常迅速的发展。无论是无人机的飞控系统本身等技术,还是依托于无人机这一优秀的可移动可搭载平台所衍生出来的技术都是现在可以进行实际使用的应用型技术。尤其是计算机视觉技术的迅速发展,计算机能力的提高与计算机视觉技术的快速发展,使无人机从最初的军事领域扩展到其它行业,得到了广泛应用。【1】
计算机视觉技术也是近几年来新兴的技术,其旨在让计算机能够理解其所能“看到”的图像或影像。而无人机作为一个优秀的可搭载平台,其具有优秀的图像信息捕捉能力,其能够在高空对整个大体图像进行观察,也能够通过低空飞行对特有的细节信息进行观察。而计算机视觉能为无人机提供大量丰富的视觉信息,以便获取无人机相对位置并调整方位。【2】
计算机视觉技术依托于图像处理技术,即利用计算机去处理利用摄像头或照相机所获得的数据,从而得到有效信息。然而,与图像处理为了获取信息的目标不同,计算机视觉技术更倾向于通过对得到的图像进行处理完成对目标进行分离,识别等相对“智能化”的任务。最近由于机器学习的飞速发展,计算机视觉不仅仅像以前一样只依托于经典理论的算法研究上了,深度学习在计算机视觉技术上进行了广泛的应用。
深度学习允许多个处理层的计算模型的学习和表示具有多个水平的抽象的数据,从而模拟大脑的感知并理解多模态信息,从而隐藏性地捕获大规模数据的复杂结构。【3】由于可以进行复杂的数据结构分析与运算,深度学习推动了计算机视觉的各个问题的巨大进步。例如物体检测【4】,动作追踪【5】,行动识别【6】,认为估计【7】,语义分割【8】。深度学习技术快速发展,由此产生了多种计算模型,其中较为普遍使用的是卷积神经网络(CNN),深信念网络(DBN),深玻尔兹曼机器(DBM)。这些模型通过训练与学习均能得到很好地识别效果,通常应用于计算机视觉等技术当中。但是,这些模型依托于大量的数据训练。因此,想要获得很好的实际训练效果,需要大量的已经经过正确注释的相关数据进行训练,目前许多大学或者是科研机构已经做出了许多这方面的努力,并且将这些训练用数据集公开到自己的网站上,大大降低了个体用户自己搜集训练数据的难度。除了上述难点之外,由于训练数据的庞大性,训练所消耗的计算资源非常多,现有的几种消耗资源为CPU,GPU,FPGA,其中GPU和FPGA因为具有快速阵列运算的优势被经常拿来使用。
基于深度学习的手势识别近几年也得到了迅速的发展。手势识别除了精度要求之外,现在因为要更多地应用于人机交互系统,所以必须要有一定的实时检测性。由于3D卷积神经网络的进展,实时手势区分识别已经成为了可能。【9】通过区分2D-CNN与3D-CNN的不同,现在基于3D-CNN的手势识别学习模型已经成功得到了发展应用。并且由于3D-CNN的特殊性,手势识别的精度可以得到一定的保障。同时,由于硬件技术的飞速发展与训练加速算法的不断优化,实时手势识别现在也有了质的飞越。从之前的一帧分析要数秒的时间到现在一秒可以分析十几帧。这就说明,通过手势识别技术完成人机交互是完全可能的。
考虑到无人机平台的特殊性,如果利用通常的大型计算机进行实时分析是做不到的。由于无人机工作环境的特殊性(可能在高空,寒冷等极端情况),我们需要一个小型的计算平台。其需要的特点是:1、质量轻;2、计算能力要足够强(需要能对数据快速分析,以达到实时处理分析图像的要求);3、功耗足够低(在功耗低的情况就可以利用无人机自带的电池对其进行供电,可以减少额外电源)。这样的计算平台在十年前是不可能存在的,然而随着硬件技术的快速发展,这样的小型强力计算机平台也逐渐得到了广泛的应用。例如nvdia公司开发的Jeston系列核心板通常用于无人机,智能车等平台,体积小,功耗低,计算能力强,具有多核GPU,非常适用于深度学习与智能人机交互。
除了对计算机平台有要求外,想要获得更好的人机交互体验,对无人机自身也有非常高的要求。首先,无人机平台需要具备一定的载重能力,除了搭载自己的电池,飞控系统,GPS定位系统外,还需要具备搭载中小型摄影系统,中小型开发板的能力。除此之外,为了能够进行实时的任务分析,该无人机平台应当具备能够与计算平台实时通讯的能力。幸运的是,能够达到条件的无人机不在少数,这也得益于无人机飞行控制技术的发展。
在解决了计算平台的问题和飞行平台的问题后,所剩下的便是手势识别算法选择的问题。现如今,手势识别已经比较成熟,但是对训练集的要求相当高。【10】现有手势识别技术依然不能分析出人手与场景进行交互时手的姿势。所幸的是,现在大多数的人机交互,手都是“孤立”的,即在摄像头前孤立地作出机器所能理解的手势,这也就意味着训练集的数目可以相应减少杂乱场景中的手部姿势,以此来达到快速训练的效果。考虑到交互平台的特殊性,这里的手部识别算法可以考虑最简单的点对点手势识别分析。【11】
以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。