文献综述
生物多样性监测作为生态监测的重要组成部分,在研究物种资源与生态环境,发展资源科学、生态学等方面具有十分重要的意义。其中,作为对栖息地改变和环境变化反应极为敏感的环境指示生物,鸟类是生物多样性评估与监测,以及生态环境影响评价的重要指标。在以江西鄱阳湖南矶湿地国家级自然保护区为代表的国际重要湿地栖息的白鹤等世界濒危鸟类,是相应湿地生态健康的重要指示生物,备受国际关注和国家重视。当前,研究人员对上述鸟类的监测工作仍然是采用单筒或双筒望远镜进行人工野外观察方式,难以完成鸟类栖息地选择、行为学分析等研究工作。
在目前的技术条件下,对于鸣声片段检测有以下方法。借鉴语音活动性检测 ( Voice Activity Detection,VAD) 的研究成果,文献[1]采用基于短时能量和短时过零率的双阈值算法完成声音事件检测( Acoustic Event Detection,AED)。文献[2-3]比较了多种 VAD方法,结果表明高斯混合模型 ( Gaussian Mixture Model,GMM) 方法在噪声环境下具有比较稳健的检测性能。文献[4]针对野外实测的凤头距翅麦鸡( Vanellus chilensis) 鸣声数据进行实验,验证了GMM检测方法的有效性。为了识别检测出的潜在鸣声片段对应物种,文献[5-6]通过计算潜在鸣声片段与特定物种鸣叫信号模板之间的谱图互相关(Spectrogram Cross Correlation,SPCC)来实现自动物种识别。文献[7]针对固定长度的鸣声片段谱图采用角度径向变换( Angular RadialTransform,ART) 提取了图像域特征。文献[8]提取了基于 Mel尺度的小波包分解子带倒谱系数(Wavelet Packet decomposition Subband Cepstral Coefficient,WPSCC)特征并结合支持向量机(Support Vector Machine,SVM)进行分类识别。文献[9-10]分别基于灰度共生矩阵( Gray Level Co-occurrence Matrix, GLCM) 以及和差统计法(Sum and Difference Histograms,SDH)提取了鸟鸣片段谱图对应的纹理特征向量,并开展了识别实验。文献[11] 提出了一种基于Mel子带参数化特征的鸟鸣自动识别方法。在采用GMM完成连续声监测数据的自动分段基础上,基于自回归( AutoRegressive,AR) 模型分别建模鸣声片段经过Mel带通滤波后各个子带输出的能量序列,得到能够描述不同种类鸟鸣信号谱模式信息的参数化特征,然后利用 SVM 分类器进行了分类识别。
对于鸟鸣事件的特征提取方面的研究情况如下。首先,鸟类鸣叫声声学形状描述参数方面的参数包括[12-16]:音节库的数量和组成,音节声长(sound length,SL),间歇(interval time,IT),每单个音节的脉冲个数(pulse group,PG),脉冲持续时间(pulse duration,PD),脉冲间隔时间(interlude of pulse interval,IPI),频率范围(frequency range,FR),主频率(principal frequency,PF),主频最大值(main peak frequency,MPF),相对幅值(relative amplitude,RA),基本音(basic song,BS),陪音(upper partials,UP),谐波(harmonic wave,HW)等。音节声长反映了音节的时间特征。基本音是音节中能量最高且有一定带宽的基本声;陪音是在一个音节中在基本音频率之上的成分,陪音个数能体现出鸣叫声的婉转程度;谐波是周期性震荡中,频率等于基频整数倍的正弦量。主频率是一个包括很多不同频率成分的复信号中最主要的频率,它和能量分布能够更好地反映出鸣叫声的声学特征。而在鸟类鸣叫声基于声谱的谱特征参数常用的有声谱图和美尔倒谱系数(Mel-frequency cepstrum coefficients,MFCC)。声谱图就是显示时变频谱幅度特征的图形,可以被理解为二维(2-D)的“能量密度”,描述了不同时刻、不同频率的能量分布情况。Mel倒谱利用了听觉原理和倒谱的解相关特性,具有对卷积性信道失真进行补偿的能力。Mel倒谱被证明是在声音相关的识别任务中应用最成功的特征描述之一[17]。在提取上述相关的鸟鸣事件特征方面,文献[18]总结提出了在采用通常FFT变换和声谱分析对鸟鸣叫声分析基础上,还进一步对鸟鸣叫声进行了MFCC分析,从听觉原理和倒谱的解相关特性角度对鸟鸣叫声进行频谱特征的提取,并对提取的特征向量进行主成分分析,找出贡献率比较大的特征,为鸟鸣叫声的特征提取提供了一种方法 ,为鸟鸣叫声的实际应用可行性提供了技术保障。
在关于鸟鸣事件的识别方法的研究上,常用的鸟鸣声识别方法有时域分析方法和频域分析方法,时域分析方法受限于鸟鸣声样本的选取, 难以稳定地获取鸟鸣声特征来加以识别。已有多位学者在对鸟鸣声进行识别时采用频域分析方法, 其中应用最多的就是MFCC分析方法[18-20]。而由于鸟鸣声信号具有非平稳性,传统的MFCC仅能反映鸣声信号的静态特性并且算法中直接运用 FFT处理非平稳信号存在局限性。所以目前研究中,文献[21]提出了一种基于EMD改进的结合差分的MFCC算法,对鸟类鸣叫声进行特征提取,并结合高斯混合模型进行鸟鸣声的识别。结果显示,改进MFCC的鸟鸣声识别方法的识别率达到70.09%,比未改进的鸟鸣声识别方法的识别率提高了3.42% 。
参考文献
[1] 沈少青, 宫鹏, 程晓,等. 陆生动物声音遥感:定位与误差分析[J]. 遥感学报, 2011, 15(6):1255-1275.
[2] Sahidullah M, Saha G. Comparison of Speech Activity Detection Techniques for Speaker Recognition[J]. Journal of Immunotherapy, 2012, 33(33):609-17.
[3] Alam J. Supervised/Unsupervised Voice Activity Detectors for Text-Dependent Speaker Recognition on the RSR2015 Corpus[J]. Diacritics, 2003, 9(5):1102-1107.
[4] Ganchev T D, Jahn O, Marques M I, et al. Automated acoustic detection of Vanellus chilensis lampronotus[J]. Expert Systems with Applications An International Journal, 2015, 42(15–16):6098-6111.
以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。