[发明专利]文本改写方法、装置及电子设备有效
| 申请号: | 201910111757.0 | 申请日: | 2019-02-12 | 
| 公开(公告)号: | CN109858004B | 公开(公告)日: | 2023-08-01 | 
| 发明(设计)人: | 梁宇;许春阳;陈航;程芃森;张冬;许森岚 | 申请(专利权)人: | 四川无声信息技术有限公司 | 
| 主分类号: | G06F40/166 | 分类号: | G06F40/166;G06F40/30;G06F40/284;G06N3/0442 | 
| 代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 唐维虎 | 
| 地址: | 610000 四*** | 国省代码: | 四川;51 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 文本 改写 方法 装置 电子设备 | ||
1.一种文本改写方法,其特征在于,应用于电子设备,所述电子设备配置有包括双向循环神经网络及门控循环单元网络的神经网络模型,所述方法包括:
获取待改写文本;
将所述待改写文本输入训练后的双向循环神经网络进行语义识别,得到与所述待改写文本对应的语义编码;
将所述语义编码输入训练后的门控循环单元网络进行处理,所述门控循环单元网络根据所述语义编码中包含的信息得到与所述待改写文本对应的多个目标词汇,将所述多个目标词汇分别作为起始词,并预测所述起始词之后的词汇,得到与所述语义编码对应的多个改写文本;
对所述多个改写文本进行评分,得到每一个改写文本对应的得分;
根据所述得分从所述多个改写文本中选择对应得分大于预设阈值的改写文本作为目标文本。
2.如权利要求1所述的方法,其特征在于,在获取待改写文本的步骤之前,所述方法还包括对所述神经网络模型进行训练的步骤,该步骤包括:
获取预先制作的文本样例对,所述文本样例对包括第一文本及与该第一文本语义相同的第二文本;
将所述第一文本输入所述双向循环神经网络,得到与所述第一文本对应的语义编码;
将与所述第一文本对应的语义编码及所述第二文本输入所述门控循环单元网络,得到与所述第一文本及所述第二文本对应的输出文本;
对所述输出文本进行评价,并根据评价结果判断所述神经网络模型是否收敛;
若未收敛,对所述双向循环神经网络及门控循环单元网络的参数进行调整。
3.如权利要求2所述的方法,其特征在于,所述对所述输出文本进行评价的步骤,包括:
计算所述输出文本与所述第二文本的相似度;
检测所述输出文本与所述第二文本的词汇数量的差值,并根据所述差值确定所述输出文本对应的惩罚因子;
根据所述相似度及所述惩罚因子得到所述输出文本对应的评价结果。
4.如权利要求1-3中任一项所述的方法,其特征在于,所述将所述待改写文本输入所述双向循环神经网络进行语义识别,得到与所述待改写文本对应的语义编码的步骤,包括:
对待改写文本进行分词处理,得到所述待改写文本包含的多个词汇;
通过所述双向循环神经网络对所述多个词汇进行双向识别,得到所述待改写文本对应的语义编码。
5.如权利要求4所述的方法,其特征在于,所述双向循环神经网络包括正向网络及反向网络,所述通过所述双向循环神经网络对所述多个词汇进行双向识别,得到所述待改写文本对应的语义编码的步骤,包括:
将所述多个词汇按照待改写文本的正向顺序依次输入所述正向网络,并在输入每一个词汇后对所述正向网络的隐藏状态进行更新,得到所述待改写文本对应的第一隐藏状态;
将所述多个词汇按照待改写文本的反向顺序依次输入所述反向网络,并在输入每一个词汇后对所述反向网络的隐藏状态进行更新,得到所述待改写文本对应的第二隐藏状态;
根据所述第一隐藏状态及所述第二隐藏状态,得到所述待改写文本对应的语义编码。
6.如权利要求1所述的方法,其特征在于,所述起始词及所述起始词之后的词汇分别对应一输出概率,所述对所述多个改写文本进行评分,得到每一个改写文本对应的得分的步骤,包括:
根据所述改写文本中每一个词汇对应的输出概率计算所述改写文本对应的组合概率,并将所述组合概率作为所述改写文本对应的得分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川无声信息技术有限公司,未经四川无声信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910111757.0/1.html,转载请声明来源钻瓜专利网。





