[发明专利]韵律模型训练方法及装置有效
申请号: | 202010047794.2 | 申请日: | 2020-01-16 |
公开(公告)号: | CN111261140B | 公开(公告)日: | 2022-09-27 |
发明(设计)人: | 吴朗 | 申请(专利权)人: | 云知声智能科技股份有限公司;厦门云知芯智能科技有限公司 |
主分类号: | G10L13/10 | 分类号: | G10L13/10;G10L25/30;G06N3/04;G06N3/08 |
代理公司: | 北京冠和权律师事务所 11399 | 代理人: | 赵真 |
地址: | 100000 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 韵律 模型 训练 方法 装置 | ||
本发明是关于韵律模型训练方法及装置。该方法包括:接收包含韵律标注信息的训练语料;将所述训练语料输入至待训练的韵律模型,以得到韵律输出结果;根据所述韵律输出结果和/或所述韵律标注信息,对所述待训练的韵律模型的网络参数进行训练,得到目标韵律模型。通过本发明的技术方案,使得目标韵律模型是个性化的、适应性和精准度较高的韵律模型,可更好地从不同来源的训练数据中学习标注共性,如此,有利于提高韵律词边界、韵律短语边界的预测准确率和韵律模型的鲁棒性。
技术领域
本发明涉及神经网络技术领域,尤其涉及韵律模型训练方法及装置。
背景技术
目前,为了预测韵律词、韵律短语的边界,通常都会使用预先/事先设置好的韵律模型进行预测,而这种韵律模型比较固定,因而,会导致韵律词的边界、韵律短语的边界的预测错误,从而降低韵律词边界、韵律短语边界的预测准确率。
发明内容
本发明实施例提供了韵律模型训练方法及装置。所述技术方案如下:
根据本发明实施例的第一方面,提供一种韵律模型训练方法,包括:
接收包含韵律标注信息的训练语料;
将所述训练语料输入至待训练的韵律模型,以得到韵律输出结果;
根据所述韵律输出结果和所述韵律标注信息,对所述待训练的韵律模型进行训练,得到目标韵律模型。
在一个实施例中,所述待训练的韵律模型包括:第一神经网络和第二神经网络;所述第二神经网络包括第一条件随机场层和第二条件随机场层;
所述将所述训练语料输入至待训练的韵律模型,以得到韵律输出结果,包括:
将所述训练语料输入至所述第一神经网络,得到第一输出向量;
将所述第一输出向量输入至所述第二神经网络的所述第一条件随机场层,以得到韵律词边界;
将表征所述韵律词边界的向量和所述第一输出向量组成的合成向量,输入至所述第二神经网络的所述第二条件随机场层,以得到韵律短语边界;
将所述韵律词边界和所述韵律短语边界确定为所述韵律输出结果。
在一个实施例中,所述待训练的韵律模型包括:第三神经网络;
所述根据所述韵律输出结果和所述韵律标注信息,对所述待训练的韵律模型进行训练,得到目标韵律模型,包括:
将所述第一输出向量进行处理,得到第二输出向量;
将所述第二输出向量输入至所述第三神经网络,以得到输出结果;
根据所述输出结果是否能够指示出韵律标注信息的标注人员,对所述待训练的韵律模型进行训练,得到目标韵律模型。
在一个实施例中,所述根据所述输出结果是否能够指示出韵律标注信息的标注人员,对所述待训练的韵律模型进行训练,得到目标韵律模型,包括:
当所述输出结果能够指示出韵律标注信息的标注人员时,调整所述第一神经网络、所述第二神经网络和所述第三神经网络中的参数,直至所述输出结果无法指示出所述韵律标注信息的标注人员时,将调整后的韵律模型确定为所述目标韵律模型。
在一个实施例中,所述方法还包括:
当所述输出结果无法指示出所述韵律标注信息的标注人员时,生成参数保持提示,所述参数保持提示用于指示不对所述第一神经网络、所述第二神经网络和所述第三神经网络中的参数进行调整。
根据本发明实施例的第二方面,提供一种韵律模型训练装置,包括:
接收模块,用于接收包含韵律标注信息的训练语料;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云知声智能科技股份有限公司;厦门云知芯智能科技有限公司,未经云知声智能科技股份有限公司;厦门云知芯智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010047794.2/2.html,转载请声明来源钻瓜专利网。