- 文献综述(或调研报告):
随着网络上多媒体内容的日益普及,音乐信息检索已成为一个重要而又具有挑战性的研究课题。
在MIDI音乐提取方面,已有很多研究成果。根据音乐音轨的相似度,通过利用音乐语义来压缩和准确地表示音轨,实现从大规模的音乐音轨数据集中快速、可靠地检索相关歌曲[1]。基于训练好的音乐规则,从每个音轨中计算出一个简洁的和弦进阶直方图(CPH)作为一个中层特征,可以保留描述音频内容的鉴别能力[1]。另一种新的基于MIDI主旋律提取方法[8]是采用音高作为主旋律特征向量的主要组成部分,将它作为描述音乐的旋律信息,同时还增加了音长来描述音乐的节奏信息,构建了一个二维序偶。主旋律中每个音符对应一个特征点,表示为v=lt;Pitch,Timegt;,其中Picth 是音高的值,其音符值取值范围为[0,127],Time 是对 MIDI时间tick的改进,代表了音长信息。与主旋律音符序列对应的特征向量可表示为V ={v1,v2,hellip;hellip;,vn},其中,V为整篇音乐的音符特征点序列,n为音符总数。考虑到音乐存在乐句,按乐句组织内容特征可以有效地帮助检索,因此向量V可进一步表示为:Vrsquo;={P1,P2,hellip;hellip;,Pk},其中,Vrsquo;为整篇音乐的音符特征点序列,k为乐句总数,Pi ={vi1,vi2,hellip;hellip;,vin}。该一特征向量可以很好地表示音乐的旋律和节奏。
在索引结构的设计与实现方面,文献[4]提出了一种高效的音乐检索系统数字索引技术。这种索引技术与已有的文本索引技术(将音乐对象视为字符串)有很大不同。该方法提取代表性片段(音乐短语)由函数f(c)建立索引,其中f()为映射函数,c为音乐短语的旋律轮廓。考虑到音乐数据特征的多样性,如旋律、节奏、和弦等,文献[5]讨论了已有的应用多特征索引方案,提出了一种混合索引结构,可以为音乐多特征索引节省大量内存。该索引采用多特征树结构,首先将后缀符号转换为坐标,然后插入多特征树。在不同参数下对网格双后缀树进行实验比较,验证了该方法的有效性。音乐可以被看作是一种语言,基于这种观点,文献[6]提出一种基于字典的音乐信息索引。首先从MIDI文件中自动提取采用音高序列表示的音乐旋律,然后将所有的旋律用重复的拍子组成的音乐字典分割成短语,构建所有旋律和短语的倒排索引。这种索引具有空间较小且处理效率高的优点。
参考文献:
[1]Yi Yu;Roger Zimmermann;Ye Wang;Vincent Oria.Scalable Content-Based Music Retrieval Using Chord Progression Histogram and Tree-Structure LSH.IEEE Transactions on Multimedia. 2013.Vol15,Issue:8.Pp:1969-1981.
[2]Adeel Mumtaz;Emanuele Coviello;Gert R. G. Lanckriet;Antoni B. Chan.A Scalable and Accurate Descriptor for Dynamic Textures Using Bag of System Trees.IEEE Transactions on Pattern Analysis and Machine Intelligence.2015.Vol37,Issue4.pp:697-712
[3]Chia-Hao Chung;Homer Chen.Vector representation of emotion flow for popular music.
2015 IEEE 17th International Workshop on Multimedia Signal Processing (MMSP).2015.pp:1-6.
以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。