[发明专利]语音处理方法及装置、计算机可读介质、电子设备在审
| 申请号: | 202011139830.4 | 申请日: | 2020-10-22 |
| 公开(公告)号: | CN112349294A | 公开(公告)日: | 2021-02-09 |
| 发明(设计)人: | 李应弟;刘洪;李丹;贾鹏飞 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
| 主分类号: | G10L25/03 | 分类号: | G10L25/03;G10L25/48;G10L15/02;G10L15/183 |
| 代理公司: | 深圳市隆天联鼎知识产权代理有限公司 44232 | 代理人: | 叶虹 |
| 地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音 处理 方法 装置 计算机 可读 介质 电子设备 | ||
本公开提供了一种语音处理方法及装置、计算机可读介质、电子设备,涉及人工智能领域。方法包括:获取具有变异音的语音信息,对语音信息进行预处理以获取语音特征信息;对语音特征信息进行特征提取,以获取与语音特征信息对应的状态信息;根据状态信息和多发音词典确定与语音信息对应的具有标准音的文本信息,其中多发音词典是根据具有标准音的第一词汇和与第一词汇具有相同语义且具有变异音的第二词汇构建的,第一词汇和第二词汇为拼音文字。本公开能够基于标准音音素和变异音音素之间的发音变异规则确定多发音词典,避免了大量标注语料,节省了标注成本和时间,并且能够根据多发音词典进行语音处理,提高了处理效率和精准度。
技术领域
本公开涉及人工智能技术领域,具体而言,涉及一种语音处理方法、语音处理装置、计算机可读介质及电子设备。
背景技术
语言是由词汇按一定的语法所构成的语音表义系统,世界各个民族都有自己的语言,即使是同一个民族也会衍生出多种不同的语言,并且各类语言中还会存在发音变异的现象,例如新疆维吾尔自治区有45%的居民是维吾尔族,维吾尔语是他们主要的沟通工具,目前维吾尔语方言分为中心方言、和田方言和罗布方言,其中中心方言对应标准音,是新疆通用的官方标准语,而和田方言和罗布方言对应变异音,只在局部地区被使用。
随着人工智能技术的发展,人们主要通过机器学习模型进行语音处理任务。在对机器学习模型进行训练时,通常需要对具有变异音的语料进行标注,然后再根据标注的语料进行标注建模,但是由于语料标注难度大,并且对标注者的语言能力要求高,因此使得人工标注周期长,成本高,同时由于语料库有限,导致训练后的模型性能一般,无法有效识别具有变异音的语音信息,进而降低了用户体验。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开的实施例提供了一种语音处理方法、语音处理装置、计算机可读介质及电子设备,进而至少在一定程度上可以基于语言规则直接建立具有标准音的语言和具有变异音的语言的发音变异规则,进而根据具有标准音的词汇和对应的具有变异音的词汇构建多发音词典,并根据多发音词典进行语音处理,避免了人工标注,降低了人工标注成本,并且基于多发音词典可以提高对具有变异音的语音信息的处理精度和处理效率。
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
根据本公开实施例的一个方面,提供了一种语音处理方法,包括:获取具有变异音的语音信息,对所述语音信息进行预处理以获取语音特征信息;对所述语音特征信息进行特征提取,以获取与所述语音特征信息对应的状态信息;根据所述状态信息和多发音词典确定与所述语音信息对应的具有标准音的文本信息,其中所述多发音词典是根据具有标准音的第一词汇和与所述第一词汇具有相同语义且具有变异音的第二词汇构建的,所述第一词汇和所述第二词汇为拼音文字。
根据本公开实施例的一个方面,提供了一种语音处理装置,包括:预处理模块,用于获取具有变异音的语音信息,对所述语音信息进行预处理以获取语音特征信息;状态信息获取模块,用于对所述语音特征信息进行特征提取,以获取与所述语音特征信息对应的状态信息;文本获取模块,用于根据所述状态信息和多发音词典确定与所述语音信息对应的具有标准音的文本信息,其中所述多发音词典是根据具有标准音的第一词汇和与所述第一词汇具有相同语义且具有变异音的第二词汇构建的,所述第一词汇和所述第二词汇为拼音文字。
根据本公开实施例的一个方面,提供了一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现如上述的可选实现方式中提供的语音处理方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011139830.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种变电站图纸资料管理查询系统
- 下一篇:一种新一代信息技术用图像识别设备





