[发明专利]韵律预测模型的优化方法及系统有效
| 申请号: | 201911421271.3 | 申请日: | 2019-12-31 |
| 公开(公告)号: | CN111128122B | 公开(公告)日: | 2022-08-16 |
| 发明(设计)人: | 张晴;张辉 | 申请(专利权)人: | 思必驰科技股份有限公司 |
| 主分类号: | G10L13/10 | 分类号: | G10L13/10;G10L13/08 |
| 代理公司: | 北京商专永信知识产权代理事务所(普通合伙) 11400 | 代理人: | 黄谦;车江华 |
| 地址: | 215123 江苏省苏州市苏*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 韵律 预测 模型 优化 方法 系统 | ||
1.一种韵律预测模型的优化方法,包括:
对韵律预测模型预测错误的语句进行分词,其中,所述语句中韵律错误的词语带有韵律标记;
将不带有所述韵律标记的词语确定为可替换词语,将带有所述韵律标记的词语确定为不可替换词语,对所述语句中可替换词语进行同义词增强,生成所述语句的第一训练数据集;
通过文本相似度从语料池中获取与所述语句相似的其他语句,将所述其他语句向开发者反馈,接收开发者对所述其他语句内的词语韵律标记后的第二训练数据集;
基于至少一部分的所述第一训练数据集以及至少一部分的所述第二训练数据集生成第三训练数据集,通过所述第三训练数据集对所述韵律预测模型进行自适应训练,以优化所述韵律预测模型。
2.根据权利要求1所述的方法,其中,所述基于至少一部分的所述第一训练数据集以及至少一部分的所述第二训练数据集生成第三训练数据集包括:
在所述第一训练数据集中提取一部分语句确定为第一训练集,提取另一部分语句确定为第一校验集;
在所述第二训练数据集中提取一部分语句确定为第二训练集,提取另一部分语句确定为第二校验集;
将所述第一训练集以及所述第二训练集进行混合,得到第三训练数据集。
3.根据权利要求2所述的方法,其中,在所述通过所述第三训练数据集对所述韵律预测模型进行自适应训练之后,所述方法包括:
将所述第一校验集以及所述第二校验集进行混合,得到第三校验数据集;
通过所述第三校验数据集对训练后的韵律预测模型进行校验。
4.根据权利要求1所述的方法,其中,在所述对韵律预测模型预测错误的语句进行分词之前,所述方法包括:
对所述预测错误的语句进行文本正则化。
5.一种韵律预测模型的优化系统,包括:
语句分词程序模块,用于对韵律预测模型预测错误的语句进行分词,其中,所述语句中韵律错误的词语带有韵律标记;
同义词增强程序模块,用于将不带有所述韵律标记的词语确定为可替换词语,将带有所述韵律标记的词语确定为不可替换词语,对所述语句中可替换词语进行同义词增强,生成所述语句的第一训练数据集;
相似语句获取程序模块,用于通过文本相似度从语料池中获取与所述语句相似的其他语句,将所述其他语句向开发者反馈,接收开发者对所述其他语句内的词语韵律标记后的第二训练数据集;
模型优化程序模块,用于基于至少一部分的所述第一训练数据集以及至少一部分的所述第二训练数据集生成第三训练数据集,通过所述第三训练数据集对所述韵律预测模型进行自适应训练,以优化所述韵律预测模型。
6.根据权利要求5所述的系统,其中,所述模型优化程序模块用于:
在所述第一训练数据集中提取一部分语句确定为第一训练集,提取另一部分语句确定为第一校验集;
在所述第二训练数据集中提取一部分语句确定为第二训练集,提取另一部分语句确定为第二校验集;
将所述第一训练集以及所述第二训练集进行混合,得到第三训练数据集。
7.根据权利要求6所述的系统,其中,所述模型优化程序模块还用于:
将所述第一校验集以及所述第二校验集进行混合,得到第三校验数据集;
通过所述第三校验数据集对训练后的韵律预测模型进行校验。
8.根据权利要求5所述的系统,其中,所述语句分词程序模块还用于:
对所述预测错误的语句进行文本正则化。
9.一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-4中任一项所述方法的步骤。
10.一种存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-4中任一项所述方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于思必驰科技股份有限公司,未经思必驰科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911421271.3/1.html,转载请声明来源钻瓜专利网。





