[发明专利]韵律预测模型的优化方法及系统有效
申请号: | 201911421271.3 | 申请日: | 2019-12-31 |
公开(公告)号: | CN111128122B | 公开(公告)日: | 2022-08-16 |
发明(设计)人: | 张晴;张辉 | 申请(专利权)人: | 思必驰科技股份有限公司 |
主分类号: | G10L13/10 | 分类号: | G10L13/10;G10L13/08 |
代理公司: | 北京商专永信知识产权代理事务所(普通合伙) 11400 | 代理人: | 黄谦;车江华 |
地址: | 215123 江苏省苏州市苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 韵律 预测 模型 优化 方法 系统 | ||
本发明实施例提供一种韵律预测模型的优化方法。该方法包括:对韵律预测模型预测错误的语句进行分词;将不带有韵律标记的词语确定为可替换词语,对语句中可替换词语进行同义词增强,生成语句的第一训练数据集;通过文本相似度从语料池中获取与语句相似的其他语句,将其他语句向开发者反馈,接收开发者对其他语句内的词语韵律标记后的第二训练数据集;基于第一训练数据集以及第二训练数据集生成第三训练数据集,通过第三训练数据集对韵律预测模型进行自适应训练,以优化韵律预测模型。本发明实施例还提供一种韵律预测模型的优化系统。本发明实施例优化有问题的语句韵律输出结果,降低了人工标注成本,节约时间,提高韵律预测模型的预测效果。
技术领域
本发明涉及智能语音领域,尤其涉及一种韵律预测模型的优化方法及系统。
背景技术
对于当前的TTS(Text To Speech,从文本到语音)系统,韵律预测的方式主要有基于统计规则和基于神经网络模型两种,无论哪种方式,对于通用语料,都有20%左右的概率出现预测不合理。在实际应用场景里,如场景常用语句出现韵律预测不合理的情况,体验会极大下降,如何基于反馈的问题语句进行有针对地优化韵律预测,提高实际场景的合成体验,对于商用的TTS系统非常重要。
目前已有的针对错误语句的韵律优化的方案有:
(1)人工增加规则:通过对错误语句的特点分析总结,基于语句里分词的词面、词性、词长、句长等信息,在系统中加入对应规则,匹配相关语句并指定韵律等级。
(2)增加训练数据:将问题语句通过人工标注后,加入到训练数据,重新训练模型或者规则,提高预测能力。
在实现本发明过程中,发明人发现相关技术中至少存在如下问题:
人工增加规则这种方案对需要优化的语句处理迅速,针对性强,但是规则灵活性不够,修改后的效果经常出现如下情况:问题语句能够预测正确,但是类似句子仍存在问题,覆盖不全面。这对于商用TTS是非常不利的。增加训练数据方案,增加的训练数据的选择十分重要,对于模型训练,如果只加入反馈的错误语句,模型很难得到针对性的加强,加入语句过多,人工标注成本大,优化周期过长。
发明内容
为了至少解决现有技术中韵律预测模型的训练覆盖不全面,难以对模型得到针对性加强,数据的人工标注成本大,周期长的问题。
第一方面,本发明实施例提供一种韵律预测模型的优化方法,包括:
对韵律预测模型预测错误的语句进行分词,其中,所述语句中韵律错误的词语带有韵律标记;
将不带有所述韵律标记的词语确定为可替换词语,将带有所述韵律标记的词语确定为不可替换词语,对所述语句中可替换词语进行同义词增强,生成所述语句的第一训练数据集;
通过文本相似度从语料池中获取与所述语句相似的其他语句,将所述其他语句向开发者反馈,接收开发者对所述其他语句内的词语韵律标记后的第二训练数据集;
基于至少一部分的所述第一训练数据集以及至少一部分的所述第二训练数据集生成第三训练数据集,通过所述第三训练数据集对所述韵律预测模型进行自适应训练,以优化所述韵律预测模型。
第二方面,本发明实施例提供一种韵律预测模型的优化系统,包括:
语句分词程序模块,用于对韵律预测模型预测错误的语句进行分词,其中,所述语句中韵律错误的词语带有韵律标记;
同义词增强程序模块,用于将不带有所述韵律标记的词语确定为可替换词语,将带有所述韵律标记的词语确定为不可替换词语,对所述语句中可替换词语进行同义词增强,生成所述语句的第一训练数据集;
相似语句获取程序模块,用于通过文本相似度从语料池中获取与所述语句相似的其他语句,将所述其他语句向开发者反馈,接收开发者对所述其他语句内的词语韵律标记后的第二训练数据集;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于思必驰科技股份有限公司,未经思必驰科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911421271.3/2.html,转载请声明来源钻瓜专利网。