基于Gabor滤波器组的特征融合人脸表情识别研究文献综述

 2022-11-01 14:32:03

文献综述(或调研报告):

1992年的时候,人脸表情识别仍然没有被较多涉及[1],而经过了20多年的发展,表情识别的算法已经发展出了几种成熟的流程。人脸表情识别的一个难点在于:当人类识别他人表情的时候,除了静态视觉图像之外,与此人的熟悉程度、对于不同种类表情的通常经验、对脸部的注意程度以及一些非视觉因素都会对这个判断造成影响[1]。这就注定计算机在认识人脸表情的时候会比较难以达到日常生活中的实际发生的那样容易。现在常见的人脸表情识别系统包括图像获取、预处理、表情特征提取和表情分类四个功能组成,最核心、亦为主要难点的地方就在于如何获得完整、鲁棒、紧凑而富有区分度的特征[4]。表情特征主要有灰度特征、运动特征和频率特征三种。表情识别方法主要有整体分析与识别法和局部分析与识别法、形变提取法和运动提取法、几何特征法和容貌特征法三个研究方向。

局部特征与整体特征的矛盾在于前者虽然能够最详细地描述细节特征的变化,但是无法对于整体的光照分布、遮罩、偏转或全局的联系等做出响应,当然局部特征在表情识别中仍然是比较优越的,识别率比全局特征多出约4个百分点[4]。另一方面,整体特征之中确实也含有丰富的判别信息,所以在一定程度上平衡二者会取得更优的结果。特征的提取分为形变提取法和运动提取法两大类。基于形变的特征提取法之中具有代表性的包括:主动外观模型(AAM)、主动形状模型(ASM)、Gabor变换和Fisher特征等。而基于运动的特征提取方法有光流法、运动模型法和特征点跟踪法等[6]。从运算复杂度的角度考虑,几何特征:例如基于人脸特征点人为选择出来的距离、角度等特征计算耗时较短,但是由于大量丢失纹理特征而导致识别结果低下(约80%或更高一些),纹理特征由于大多使用卷积等复杂的计算方法,特征维度可以达到原人脸图像像素数的数倍,但是准确率可以达到95%以上。几何特征的选取更加具有经验性,而纹理特征则不是非常直观。

1999年Donato等曾比较几种方法识别脸部AU的性能,表明Gabor小波特征和基于PCA的独立成分分析方法(ICA)效果较优。Gabor小波函数是一个高斯函数调制得到的复数域正弦曲线,其核心类似于哺乳动物皮层简单细胞的二维感受野轮廓,在空间分析和频域的最佳局域化属性[9]。并且Gabor函数的对于局部的多尺度、多方向空间频率特征都可以很好的观测[5],优良的特性使得其得到了广泛的运用。并且,研究者们一直不断对基本的Gabor特征进行改进,比如选取原始Gabor特征的部分尺度或者方向上部分作为进行识别,或者将Gabor特征与其它种类的特征结合起来。也有使用更加新颖的方法结合Gabor特征的,比如说将局部二值模式与Gabor特征结合起来形成局部Gabor二值模式方法[11]。而为了弥补Gabor特征对于图像全局特征的描述能力不足,亦有比如全局Gabor相限模型、直方图方法等被提出来。刘帅帅等则给出了一种基于Gabor多方向融合特征与分块直方图结合的方法,平衡了局部与全局特征,并且有效的抛弃了冗余数据、保留了对于分类最为有效的信息[4]。

不同特征的选择会在相当大的程度上影响识别结果。同样影响识别结果的还有特征变换的方法,比如使用PCA、LDA之类的方法对特征进行压缩,这样的方法不仅仅是降低了数据维度、节约了大量计算所消耗的时间资源,更是能够提升识别准确率。PCA方法与LDA方法很难说孰优孰劣,通常人们认为LDA方法表现更好,但是PCA方法对于小样本来说更加优越,而对于不同的训练数据集、PCA不会非常敏感[7]。针对PCA方法将图像矩阵先处理成列向量并造成结果的协方差矩阵难以计算的情况(很多时候由于样本过小而不得不使用奇异值分解的方法近似求解),2DPCA做出了重要改进:以矩阵而不是向量为计算基础,较PCA有至少两个优点:1、更容易准确计算协方差矩阵,2、计算特征向量所需时间更短[10]。而D2DPCA方法则对于以列为基础的2DPCA方法做出了改进,可以运用于任意方向,通过建立一个D2DPCA库可以进一步提升识别准确率[8]。

最后,分类器的改进也十分重要,过去使用K近邻(KNN)分类法虽然表现也非常优秀,但是当特征维度较高而样本较少、或者存在误分类点的时候,KNN方法表现不如SVM方法优秀,后者结合核函数的使用能够得到非常出色的结果,在文献[4]中我们也可以看到这样的差异造成了SVM对于KNN的微弱优势。文献[5]则针对表情的模糊性提出了一种基于Gabor小波特征的模糊分类器集成,效果也非常出色。

这些改进对于对表情识别结果造成的提高非常明显,同样以JAFFE表情库的分类结果来看,1998年Nectarios Rose等人使用基于局部特征点的Gabor小波特征达到了86%左右的识别率,并且对表情区特征点对齐的要求过高。而后,Sun Wenyu等人使用2DPCA算法取代PCA对特征进行降维,得到了更好的识别率,罗非等尝试改进该2DPCA方法得到了90%的识别率,并进一步利用模糊分类器达到了98.3%的识别率[5]。而在文献[6]中,使用几何特征与Fisher特征的混合特征,得到识别率则为91.7%。邓洪波等研究者使用PCA LDA相结合的两个阶段的特征压缩方法对特征向量进行降维、并进行光照均一化处理,最好平均识别率达到了 97.33%。文献[4]则提出了独特的融合特征方法,对Gabor的多方向特征进行融合并与分块直方图统计相结合,这种方法弥补了Gabor特征对于纹理图像全局特征的描述能力,最高平均识别率达到98.24%。

[1] Samal A, Iyengar P A, Automatic Recognition and Analysis of Human Faces and Facial Expressions [J], Pattern Recognition, 1992, 25:65-77.

[2] Chellappa R, Wilson CL, Sirohry S. Human and Machine Recognition of Faces: A Survey [J], Proceedings of the IEEE, 1995, 83(5):705-740.

[3] Zhao, Chellappa, Rosenfeld, Phillips, Face Recognition: A Literature Survey [J], ACM Computing Surveys, 2003, 35(4):399-458.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。