[发明专利]语音处理方法、装置和介质在审
申请号: | 202010763575.4 | 申请日: | 2020-07-31 |
公开(公告)号: | CN112037756A | 公开(公告)日: | 2020-12-04 |
发明(设计)人: | 叶一川 | 申请(专利权)人: | 北京搜狗科技发展有限公司 |
主分类号: | G10L13/04 | 分类号: | G10L13/04;G10L13/047;G10L13/08 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 苏培华 |
地址: | 100084 北京市海淀区中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 处理 方法 装置 介质 | ||
1.一种语音处理方法,其特征在于,所述方法包括:
展示文本中多音字当前的读音信息;所述文本用于语音合成处理;所述当前的读音信息为依据所述多音字及其上下文得到;
依据用户针对所述当前的读音信息的纠正操作,展示所述多音字对应的读音输入接口,以供用户输入修正后的读音信息;
依据修正后的读音信息,对所述文本进行语音合成。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
依据所述多音字及其上下文、以及包含多音字的标注语料,确定所述文本中多音字当前的读音信息。
3.根据权利要求1所述的方法,其特征在于,所述展示文本中多音字当前的读音信息,包括:
在对所述文本进行语音合成之前,展示文本中多音字当前的读音信息。
4.根据权利要求1所述的方法,其特征在于,所述展示所述多音字对应的读音输入接口,包括:
展示所述多音字对应的读音选项,以供用户选择;或者
展示所述多音字对应的读音输入框,以供用户输入。
5.根据权利要求1至4中任一所述的方法,其特征在于,所述依据修正后的读音信息,对所述文本进行语音合成,包括:
依据修正后的读音信息,对所述多音字对应的完整文本进行语音合成。
6.根据权利要求1至4中任一所述的方法,其特征在于,所述文本包括:第一部分文本和第二部分文本;在确定所述修正后的读音信息之前,确定所述第二部分文本对应的第二部分合成结果;
则所述依据修正后的读音信息,对所述文本进行语音合成,包括:
依据修正后的读音信息,对所述多音字对应的第一部分文本进行语音合成,以得到对应的第一部分合成结果;
对所述第一部分合成结果和所述第二部分合成结果进行融合,以得到所述文本对应的语音合成结果。
7.根据权利要求1至4中任一所述的方法,其特征在于,所述方法还包括:
展示文本中语言单元当前的情感参数;
依据用户针对所述当前的情感参数的修正操作,展示所述语言单元对应的情感输入接口,以供用户输入修正后的情感参数。
8.一种语音处理装置,其特征在于,包括:
第一展示模块,用于展示文本中多音字当前的读音信息;所述文本用于语音合成处理;所述当前的读音信息为依据所述多音字及其上下文得到;
第二展示模块,用于依据用户针对所述当前的读音信息的纠正操作,展示所述多音字对应的读音输入接口,以供用户输入修正后的读音信息;
第一语音合成模块,用于依据修正后的读音信息,对所述文本进行语音合成。
9.一种用于语音处理的装置,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
展示文本中多音字当前的读音信息;所述文本用于语音合成处理;所述当前的读音信息为依据所述多音字及其上下文得到;
依据用户针对所述当前的读音信息的纠正操作,展示所述多音字对应的读音输入接口,以供用户输入修正后的读音信息;
依据修正后的读音信息,对所述文本进行语音合成。
10.一个或多个机器可读介质,其特征在于,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如权利要求1至7中一个或多个所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司,未经北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010763575.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种汽轮机汽封齿的铆齿装置及其方法
- 下一篇:一种自动刮鱼鳞的装置