-
文献综述 - 国内外研究现状
随着全球智能语音相关技术突飞猛进的进步,各行各业的智能信息化与语音相关技术的融合越来越引起业界的关注[5]。然而目前在国内,方言识别仍然是一项令人头疼的问题,其核心问题是方言数据采集。由于方言种类繁多,具有地域性、稳定性、反映性[15],需要庞大的客户群体,因此,想要获得海量而又准确的方言数据,的确不是一件容易的事情。
科技的高速发展,使得移动互联网已经成为了人们生活中的一部分。截至2016年,移动互联网用户达到6.56亿,手机上网比例从2015年的90.1%上升到92.5%【1】。微信是时下最火爆的社交软件之一,其用户量居高不下,成为了几乎人人必备的社交工具。而作为它的衍生品,微信小程序也成为目前最火热的应用之一,微信庞大的用户基数为微信小程序的发展奠定基础,微信小程序无需下载注册,作为轻型应用很可能会是未来移动互联网应用的主要形式[3]。语音数据采集是一项需要庞大用户量才有可能完成的工作,而微信小程序用户量庞大以及方便快捷的特点,无疑让其成为了采集语音数据绝佳的平台。
- 微信小程序的研究现状
微信小程序出现后,各行业都在进军小程序领域,如:时尚业,服务业,餐饮业等,给予了我们生活极大的便利。除了小程序,微信小游戏近年来更是刷爆了朋友圈和微信群,微信游戏产品总监孙春光在2018年微信公开课上发表小程序游戏数据, 数据显示, 微信小游戏已累计用户达到了3.1亿, 其中22%是非游戏用户, 可见, 小程序游戏的快速发展, 离不开微信庞大的用户基数[12]。
目前研究对于小程序在语音方面的应用也有所涉及,许多小程序都加入了语音的功能,比如小游戏中,玩家直接可以通过语音进行沟通,又或是部分涉及语言类的小程序,可以看到,小程序对于语音方面的功能都是支持的。
- 智能语音和语音数据采集的研究现状
目前,国内外对于智能语音和语音数据采集的研究非常丰富,国外在这一领域暂时处于领先地位。近年来,电商巨头亚马逊正在研发一款新型的可穿戴设备,该设备将通过识别佩戴者的声音而判断其情绪。除了亚马逊以外,包括微软、谷歌、IBM以及其他大型客机公司,都在进行将人类情绪数字化相关的研发,数据获取的范围包括图像、音频及其他数据源[6]。在国内,虽然在智能方面相对于国外还有欠缺,但是近几年国内智能语音市场也取得了长足的进步,各种基于智能语音的产品层出不穷,包括智能语音解锁、智能语音呼叫等。语音数据采集方面,目前对于语音数据的采集更多的是基于面对面的方式,根据需要选定发音人,然后再进行数据采集【7】,或者是基于平台的方式,相对快捷地收集数据。目前的收集方式虽然简单暴力,效率也还可观,但对于日新月异的科技来说,总需要一种更加智能的方式来完成这一过程。
- 研究主要成果
- 微信小程序的研究主要成果
微信小程序最为人津津乐道的就是它便于日常生活的庞大功能了,它已经深入了人们日常生活的方方面面。首先,是外出吃饭时的点餐功能。在传统就餐模式下,经常会存在由于就餐人数众多导致排队时间过长、客户点餐效率低下等问题。因此,开发了基于微信小程序的点餐系统,给用户提供了极大的便利,并且能够在一定程度上缓解用户就餐效率低、高峰期用餐拥堵等问题【9】。其次,是人们最关心的医疗问题,目前很多大城市的医院都开设了微信小程序,人们不需要起一大早去医院排队挂号,甚至免去了电话预约的麻烦。除了简单的医疗外,空军特色医学中心皮肤科还和北京某公司联合研制了基于微信小程序的基层部队远程医疗系统,依托互联网技术,研发基于小程序的远程医疗系统,提供远程问诊,远程处方,远程药品配送等服务,实现了上级医院专家与基层一线部队人员的联动,达到了医疗资源充分共享,为基层部队提供可靠的医疗保障[10]。在旅游业上,Ao Cheng以“你如何看待旅游相关微信小程序”为主题,对200条评论进行了爬虫,对180条评论进行了数据清理分析。结果表明,与旅游相关的微信小程序在中国社交网络旅游活动中起着非常重要的作用[2]。在教育领域,微信小程序在教育教学信息展示、在线课程学习、互动交流、在线答疑等方面为老师和学生们带来了极大的便利[11]。
此外,近年来微信小程序游戏更是火爆了朋友圈。2018年元旦前夕, 微信小程序游戏“跳一跳”一经推出便迅速成为朋友圈的“新宠”, 真正成为“老少咸宜”的“霸屏”游戏。相较于客户端游戏, 小程序游戏有着轻量化的特点, 具体表现在:即点即玩、用完就走、快速回来。通常, 小程序游戏一局只有几分钟, 玩家随时可以暂停退出, 然后回来继续游戏。随着生活节奏越来越快, 用户的碎片化时间会越来越多,而微信推出的小程序游戏则非常符合用户的这一快节奏生活[12]。
- 智能语音和语音数据采集的研究主要成果
在智能语音应用方面,国内进展喜人。来自重庆大学的李磊实现了基于语音识别的帕金森病识别系统,提出采用语音幅度,基音频率,短时过零率和病龄病级四个特征参数进行预测模型的建立,并依托不断实验修改特征参数的权值来完善最终的预测模型使其能够更加精确。结合Android语言设计和Matlab开发了基于移动端的帕金森预测分析系统[4]。智能语音还可以应用在电视技术上,最典型的应用就是语音遥控。这是一种依赖智能技术有一个可以用声音来激活的微型计算机系统,它可以识别人们不同的语言,然后控制电视机的程序。再一个就是多人对话,多轮对话的场景还蛮常见的,比如说,“我想看相声”,然后你看到电视筛选结果没有你想看的,就可以接着说“郭德纲的”,智能语音必须要结合上下文语义,才能知道你想要的是“郭德纲的相声”这个结果[13]。
在语音数据采集方面,国内也有很多家互联网企业正在持续发展。京东众智是一个专业的数据采集平台。它主要进行图片采集、语音采集、文本采集、视频采集四个内容,其中语音采集也分为外语语音、普通话、方言和唤醒词,可以说是非常全面的一个数据采集平台。而它的采集过程也相当严格,对于每一个采集项目,都会配备业务经理深入了解需求,把控项目全流程。接着使用专业设备和自研软件进行数据采集,高质高效。采集完成后,专业人员进行质量检测,最后严格按照要求交付数据直到验收通过。如此严格的采集流程,高质量的数据就非常有保障了。
以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。