文 献 综 述
研究意义:
近年来,多视图学习已成为模式识别和机器学习等领域的重要内容与研究热点。一般来说,基于单幅图像的表示学习方法可能会遇到各种问题而导致诸如识别与检索等后续任务学习性能的不稳定。相比较而言,基于图像集的表示方式由于纳入了原始数据更多有用的信息,因此,以其作为一种数据表示,不仅能够更加精细地刻画原始对象,较好地约减一些不利因素的影响,而且还能使得学习算法的性能更加稳定与鲁棒。然而,基于单幅图像的子空间学习方法并不都适用于图像集的情形。因此,非常有必要研究基于图像集的低维表示方法,充分利用图像中包含的丰富信息,构建其整体判别的有效算法,对于丰富图像集的多视图理论,提高相关学习算法的实际性能,具有重要的理论和应用价值。
实际应用中,同一图像集往往有多种不同的特征表示,例如,基因可以由基因活跃特征和文本信息特征共同描述[1];同一位演讲者可由音频和视频信息共同表示[2]。这种数据一般被称为多视图数据。由于这些特征表示总是反映了相 同图像集的不同特性,因此,图像集的多视图数据分析十分有意义。另一方面,图像集的多种表示也会使得其冗余信息与维数急剧增加,这将不可避免地引发“维数灾难”[3],并强烈影响后续学习任务(如分类与检索等)的性能。因此,对图像集的多视图数据进行联合低维表示学习是一个重要的研究内容,对后续学习任务来说无疑具有重要的理论支撑与实际意义。
近来的研究表明,人类的视觉系统具有对图像的稀疏表示特性[4],神经元对于输入图像的激活机制具有高度的稀疏性。而且现有的基于稀疏表示的方法主要针对于单幅图像,并在模式分类中获得了极大的成功。而基于图像集的多视图稀疏学习研究还比较少。因此,无论从理论发展还是从实际应用的角度出发,图像集的多视图稀疏表示学习都亟需研究,对抽取出符合人类视觉感知特性的低维表示具有十分重要的意义。
国内外研究现状:
在图像识别中,基于单幅图像的模式分类问题,近年来已得到了广泛而深入的研究。然而这种分类识别方式,易受到各种干扰和退化因素的影响,如物体的遮挡与旋转、图像的校准和特征描述符的鲁棒性等问题,因此一般要求图像具有较高的成像质量和分辨率。现实生活中存在的大量图像资源,在多数场合中是以视频序列和多模态的形式给出。为了适应实际应用中系统环境的复杂性,如何利用图像集包含的丰富信息,研究和发展针对特定变化具有较强鲁棒性的模式分类技术,已引起了有关学者的关注和重视。
近年来,稀疏表示已在模式识别领域获得了广泛关注和成功应用。稀疏表示的研究通常归结为稀疏字典的设计,从不同角度出发,可以设计出满足不同应用需求的字典[5-20]。Wright 等人[21]利用样本间的稀疏性,提出了一种稀疏表示分类器(SRC)。SRC 的基本思想是:首先,利用所有训练图像构成一个完备字典;然后,以这个字典为基础,稀疏地表示待识别的测试样本,从而估计出其类别。随着数字图像及通信技术的发展,稀疏表示被广泛应用于图像集数据中[22-25],Hu 等人利用稀疏最近相似点来度量图像集之间的相似性。为了降低模型的复杂度,Wu[6]提出了协同最近点方法。但是这些方法通常对异常值和遮挡是比较敏感的。为了解决这些问题,Chen 等人[26-30]提出了基于字典学习的图像集识别方法。该方法通过对每个图像集构建一个字典,之后利用这些字典度量图像集间的相似性,可以获得较好的识别效果。
典型相关分析(CCA)[31]是一种有效的特征抽取方法,基于稀疏表示,研究者们提出了一些改进的稀疏典型相关分析方法[32-35]。在图像集分类中的应用,CCA 具有其得天独厚的先天优势。借鉴线性判别分析(LDA)的思想,Kim等人[36]提出了鉴别典型相关(DCC)方法,并将其引入到子空间的相关度量中,从线性特征抽取的角度对子空间进行了维数压缩,在图像集分类中获得了较好的实验结果。最近,Su 等[37]从所有图像集子空间的全局相关出发,提出了多主角(MPA)方法,实验结果表明,无论是在算法收敛速度上,还是在图像集识别性能上,MPA 均优于 DCC。现有研究 [38] 表明对于图像集匹配,字典学习是一种很好的解决方案。通过字典学习,图像集中的噪声可以被有效的缓解而且可以获得很好的匹配性能。目前,关于图像集的多视图稀疏典型相关学习的研究比较少,无论是从理论基础,还是实际应用都有待发展和完善。并且现有的稀疏典型
以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。