文献综述(或调研报告)(1200字左右)
基于深度学习技术,本文对三维模型识别中存在的上述问题进行了深入研究,主要工作有以下三点:(1)针对三维网格模型的分类需求,提出一种端到端集成深度学习网络EnsembleNet。将集成学习的思想融入深度学习,自动学习多视图特征生成三维模型类标签;针对该网络的特点提出层次迭代式训练方法。在ModelNet10、ModelNet40上分别取得了96%、92%的分类精度。(2)针对三维点云模型的分类需求,提出一种卷积点云网络Point CNN。将无序点云转化为有序的二维图像,使用反卷积网络进行高分辨率重建,使用卷积网络进行特征提取完成模型分类。在ModelNet10、ModelNet40上分别取得了92.6%、88.3%的分类精度。(3)针对三维点云模型的实时识别需求,提出一种轻量级点云网络LightPointNet。该网络结构紧凑、框架清晰、参数少、运行效率高。本方法与经典点云网络PointNet相比较,在Model Net10和ModelNet40的分类准确率分别提高了1%和0.1%,而训练参数仅为后者的2.1%,满足三维点云模型的实时识别需求。[基于深度学习的三维模型识别技术研究(司庆龙)]
采用基于投影的方式来提取三维模型的形状特征:首先需要对三维模型进行规范化处理,即平移,旋转和缩放。然后提取三维模型的三视图投影视图,再将模型的三视图投影视图经过去均值和预白化,划分组块等处理,转化为深度学习网络可识别的形式作为网络输入。提出了一种改进的稀疏降噪自编码网络三维模型识别方法,该方法采用一种改进的无监督和受限的拟牛顿计算方法相结合的稀疏降噪自编码模型来建造深度神经网络,从而对三维模型信息进行深层次加工处理,进而对三维模型进行分类识别。提出了一种基于拓扑稀疏编码的三维模型识别方法,该方法采用一种改进的无监督特征学习算法的拓扑稀疏编码模型来构建深度神经网络,并用贪婪算法对网络模型的代价函数JsA),(进行迭代优化,学习权值矩阵A并输出可视化特征A。从而有效改善了常用的稀疏自编码模型提取特征时间长等弊端。提出了一种权值优化深度卷积网络,同时计算三个侧面投影图的卷积网络,并将该网络应用到三维模型的识别及检索中,实验表明了该方法的有效性。[基于深度学习的三维模型识别及检索研究(王慧)]
结合深度学习和视图对三维CAD模型的分类问题进行研究:首先进行三维模型视图提取;之后结合深度学习理论,给出深层神经网络的构建方法;在应用环节,给出分类过程与结果。主要研究工作如下:⑴三维模型的视图生成视图是三维模型的描述信息,本文以视图作为深度学习模型的输入。视图的数量以及获取视图的角度都会对最终分类结果有影响。光场描述符提取的视图存在大量的冗余,而最简单的三视图却会存在丢失模型空间信息的问题,我们需要研究合适的视图获取方法。本文利用两种视图提取技术得到混合视图,输入到深度学习模型。用以提高分类的精确度。⑵构建深度卷积神经网络由于卷积神经网络在图像处理方面具有极高的处理能力,所以本文使用了深度学习里的深度卷积神经网络。构建的深层网络分类器由多层组成:输入层、若干隐藏层和输出层。将提取出来的视图作为输入,由若干隐层来提取和合成更加抽象的概念特征,输出层用来输出模型所属的类别。⑶输出层分类器的选择卷积神经网络的最后一层是输出层。输出层分类器一般选择Logistic回归或SoftMax回归。Logistic回归用来解决二分类问题,而CAD模型数据库不止两个类,SoftMax回归模型是在多分类问题上的应用,故而本文采用了SoftMax回归模型。[基于深度学习和视图的三维CAD模型分类技术研究(侯宇昆)]
由于三维模型本身的复杂性,无法将模型本身作为深度神经网络模型的直接输入,因此,需要选取适当的描述符对其进行预处理操作。通过对现有的三维模型的描述符的比对与研究,本文选择了可以将三维模型转换为参数化函数的基于形状的D2描述符。该描述符通过获取模型表面任意两点间的距离,利用形状函数计算形状概率分布,对模型特征进行刻画,该计算过程相对简单。D2形状概率分布具有两个方面的优越性:一方面当三维CAD模型发生旋转、缩放、平移等变换时,D2描述符能够较好地刻画原始模型;另一方面,若模型出现较小的边界波动,D2描述符也具有相对理想的抗干扰性,该描述符所表征的信息是三维模型中较为原始的几何信息,支撑以此为基础的更高层信息的获取,因此一定程度地避免了因特征描述符初步抽取造成的信息丢失。·通过对比现有的深度学习算法中的不同框架,了解多个框架的训练方式及特点,本文选择架构一个由多个限制性玻尔兹曼机(Restricted Boltzmann Machine,RBM)堆叠而成的深度置信网络对三维模型进行分类学习训练。这种层次结构可以将三维模型数据进行从低维到高维的特征提取,从而较好的解释模型数据。基于以上研究,本文基本实现了将深度学习算法和三维CAD模型分类的结合,通过三维CAD模型实例对该算法进行测试,初步验证了算法的有效性。[基于深度学习的三维CAD模型分类(刘钰鹏)]
基于内容的三维模型检索技术是从三维数据内容出发,利用算法自动从模型中提取出能描述其外观的特征信息,并用一种紧凑的数据结构(特征描述符)来表达这种特征。特征描述符提取是三维模型检索系统的核心部分;另外,查询接口和相关反馈机制也是三维模型检索系统的重要组成部分。本文从模型特征提取、查询接口和相关反馈机制这三个方面对三维模型检索系统展开研究,主要工作和贡献可以归纳为以下几点: (1)提出了分别适用于通用模型数据库和机械零件模型数据库的手绘草图查询接口构建方法。 查询接口在三维模型检索系统中占有很重要的地位,一个实用的检索系统应该拥有友好的查询接口。基于视图的特征描述符是实现手绘草图查询接口的基础,构建一个基于视图的特征描述符的关键步骤包括:确定投影方向、视图生成和相似性比较。本文对各种投影方向确定算法、视图生成和相似性比较方法进行研究。重点分析了两种旋转归一化算法和两种模型视图的检索性能,在此基础上给出分别适合于通用模型数据库和机械零件模型数据库的手绘草图查询接口构建方法:通用模型数据库采用PCA旋转归一算法和外轮廓图的检索性能最好,而MND旋转归一算法和轮廓图适用于机械零件模型数据库。 (2)提出了一种基于体素模型的特征提取算法,通过该算法得到的旋转不变性特征描述符比经典D2形状分布描述符具有更高的检索准确度。 基于视图的特征描述符虽然能够实现手绘草图查询接口,但是不具备旋转不变性,需对模型进行较复杂的旋转归一化预处理。另外,基于视图的特征提取方法是一种图像空间的算法,本质上是利用二维图像来衡量三维模型的相似性,而如何从三维对象本身提取特征的问题并未得到解答。本文提出了一种基于体素模型的旋转不变性特征描述符。由于体素模型包含模型的实体信息,并可将不规则的空间信号规则化,所以有利于形状分析和特征提取。本文先提出了一种将网格模型转化为体素模型的体素化算法,然后设计了两个基于体素模型的形状分布描述符D2V和DIR,它们均具有旋转不变性。D2V消除了经典D2的直方图计算会被高面积密度局部偏移的缺陷;DIR特征描述符统计表面体素之间线段在模型内外部的分布情况,得到一种不同于D2V的形状分布特征。组合DIR和D2V可获得更丰富的形状信息,提高了检索准确度。 (3)提出了两种相关反馈算法以提升三维模型特征描述符的检索性能。 相关反馈(Relevance Feedback)技术是帮助多媒体检索系统提高检索准确度的一种重要手段,近年来已逐渐被用于三维模型检索领域。本文设计了两个相关反馈算法,并将其应用于本文提出的特征描述符上。第一个算法利用用户反馈信息构建更加接近用户高层语义的查询。先建立起一个覆盖相关模型的包围球集合,然后在第二轮查询过程中用包围球和数据库中模型的特征向量进行匹配。由于包围球集合蕴含了用户语义,所以反馈后的查询准确度会得到提高。实验表明该算法能够有效地提高D2V特征描述符的检索准确度。第二个算法是利用反馈信息优化组合多个特征描述符,算法根据相关模型特征向量的分布密度来动态决定不同描述符的权值大小,实验表明此算法能较好地实现特征描述符的优化组合。 上述三个研究内容之间互相关联但又各有独立性。查询接口、模型特征提取、相关反馈机制是一个三维模型检索系统的主要组成模块,其中模型特征提取是基础,查询接口和反馈机制的设计依赖于特征提取算法;手绘草图查询接口实现用户输入的查询草图和模型视图之间的匹配;相关反馈机制是为了提高特征描述符的检索性能、缩小模型低层特征与用户查询之间的语义差异。[基于内容的三维模型检索关键技术研究(王家乐)]
深度学习受到了越来越多研究者的关注,它在特征提取和模型拟合 上都有着相较于浅层模型显然的优势。深度学习善于从原始输入数据中挖掘越来越抽象的分布式特征表示,而这些表示 具有良好的泛化能力。它解决了过去人工智能中被认为难以解决的一些问题。且随着训练数据集数量的显著增长以及芯 片处理能力的剧增,它在目标检测和计算机视觉、自然语言处理、语音识别和语义分析等领域成效卓然,因此也促进了 人工智能的发展。深度学习是包含多级非线性变换的层级机器学习方法,深层神经网络是目前的主要形式,其神经元间 的连接模式受启发于动物视觉皮层组织,而卷积神经网络则是其中一种经典而广泛应用的网络结构。卷积神经网络的局 部连接、权值共享及池化操作等特性使之可以有效地降低网络的复杂度,减少训练参数的数目,使模型对平移、扭曲、 缩放具有一定程度的不变性,并具有强鲁棒性和容错能力,且也易于训练和优化网络结构。基于这些优越的特性,它在 各种信号和信息处理任务中的性能优于标准的全连接神经网络。本文首先概述了卷积神经网络的发展历史,然后分别描 述了神经元模型、多层感知器的结构。接着,详细分析了卷积神经网络的结构,包括卷积层、取样层、全连接层,它们 发挥着不同的作用。然后,讨论了网中网结构、空间变换网络等改进的卷积神经网络。同时,还分别介绍了卷积神经网 络的监督学习、无监督学习训练方法以及一些常用的开源工具。此外,本文以图像分类、人脸识别、音频检索、心电图 分类及目标检测等为例,对卷积神经网络的应用作了归纳。卷积神经网络与递归神经网络的集成是一个途径。为了给读 者以尽可能多的借鉴,本文还设计并试验了不同参数及不同深度的卷积神经网络以图把握各参数间的相互关系及不同参 数设置对结果的影响。[周飞燕,金林鹏,董军, 卷积神经网络研究综述,2017, Vol.40,在线出版号 No.7]
深度学习主要通过搭建含有多个隐含层的神经网络模型,同时利用大量的训练样本来学习得到更有利用价值的特征,进而提升网络模型的预测,分类的准确性。卷积神经网络作为深度学习一个重要的网络模型,其具有结构层次化、权值共享、区域局部感知、特征抽取和分类过程结合的全局训练等特点,在图像识别领域获得了广泛的应用,特别是深度卷积神经网络是目前的研究热点,对其本身及在不同样本的识别上的应用进行研究具有重要的应用价值。本文在整理和总结了国内外相关深度学习和卷积神经网络的发展经过和研究成果,并对深度学习特别是卷积神经网络的基本概念和算法进行了总结和介绍。以经典的卷积神经网络模型为基础,以手写数字作为实验样本,通过多样本和少样本两种实验找出网络深度、卷积核大小和数量对系统性能的影响。针对实际应用过程中样本数量少的问题,通过修正网络激活函数,改变传统网络只利用样本最后一级的特征进行目标识别,将网络得到的各级样本特征全部送到全连接层进行目标识别,进而构建新的卷积神经网络模型,并将其应用到人脸识别和遮挡目标识别等任务当中,实验表明该模型具有较好的识别能力。[基于卷积神经网络的深度学习算法与应用研究(张效荣)]
深度学习是一项比较复杂的机器学习算法,在图像识别方面和语音识别方面,深度学习均取得了一定的效果,深度学习被人们看作是一种先进丶新颖的技术。深度学习在个性化技术丶语音丶自然语言处理丶机器翻译丶多媒体学习丶机器学习丶数据挖掘丶搜索技术等诸多方面都取得了很好的成果。通过深度学习,机器可以对人类活动进行模仿,例如思考活动和试听活动等,从本质上解决了复杂模式识别等难题,使人工智能技术等相关技术都在一定程度上获得了进步,把各种实际应用研究与深度学习有机结合起来是一项不可或缺的工作。[基于卷积神经网络探究深度学习算法与应用(高强,靳其兵,程勇)]
以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。