[发明专利]文本改写方法、装置及电子设备有效
| 申请号: | 201910111757.0 | 申请日: | 2019-02-12 |
| 公开(公告)号: | CN109858004B | 公开(公告)日: | 2023-08-01 |
| 发明(设计)人: | 梁宇;许春阳;陈航;程芃森;张冬;许森岚 | 申请(专利权)人: | 四川无声信息技术有限公司 |
| 主分类号: | G06F40/166 | 分类号: | G06F40/166;G06F40/30;G06F40/284;G06N3/0442 |
| 代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 唐维虎 |
| 地址: | 610000 四*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 文本 改写 方法 装置 电子设备 | ||
本申请提供一种文本改写方法、装置及电子设备,涉及计算机技术领域。其中,所述文本改写方法采用双向循环神经网络对文本进行处理,可以结合上下文内容对待改写文本进行语义识别,提高语义理解的准确性;同时,采用门控循环单元网络对该双向循环神经网络识别到的语义编码进行处理,可以在保证其改写性能的同时提高其训练效率;此外,在本申请实施例提供的文本改写方法中,通过对门控循环单元网络处理后得到的多个改写文本进行评分,然后根据其得分从多个改写文本中选择满足要求的改写文本作为目标文本,可以提高文本改写结果的多样性。
技术领域
本申请涉及计算机技术领域,具体而言,涉及一种文本改写方法、装置及电子设备
背景技术
语言是人类交流的载体,是人们生活中不可或缺的重要组成部分。但由于年龄、生活习惯、教育程度、方言特色等不同,人们对相同事物的描述、用词会存在千差万别。跨年龄、跨地域、跨背景、跨领域的交流容易让人感到迷惑,甚至产生误解。
因此,如何运用计算机技术将交流语言转换为便于理解的形式,对于本领域技术人员而言具有重要的研究意义。
发明内容
为了解决现有技术中的上述问题,本申请提供一种文本改写方法、装置及电子设备,以实现将文本转换为具有相同语义的其他文本。
为了实现上述目的,本申请较佳实施例采用的技术方案如下:
第一方面,本申请实施例提供一种文本改写方法,该方法可以应用于电子设备,所述电子设备配置有包括双向循环神经网络及门控循环单元网络的神经网络模型,所述方法包括:
获取待改写文本;
将所述待改写文本输入训练后的双向循环神经网络进行语义识别,得到与所述待改写文本对应的语义编码;
将所述语义编码输入训练后的门控循环单元网络进行处理,得到与所述语义编码对应的多个改写文本;
对所述多个改写文本进行评分,得到每一个改写文本对应的得分;
根据所述得分从所述多个改写文本中选择对应得分大于预设阈值的改写文本作为目标文本。
在本申请实施例中,在获取待改写文本的步骤之前,所述方法还包括对所述神经网络模型进行训练的步骤,该步骤包括:
获取预先制作的文本样例对,所述文本样例对包括第一文本及与该第一文本语义相同的第二文本;
将所述第一文本输入所述双向循环神经网络,得到与所述第一文本对应的语义编码;
将与所述第一文本对应的语义编码及所述第二文本输入所述门控循环单元网络,得到与所述第一文本及所述第二文本对应的输出文本;
对所述输出文本进行评价,并根据评价结果判断所述神经网络模型是否收敛;
若未收敛,对所述双向循环神经网络及门控循环单元网络的参数进行调整。
可选地,在本申请实施例中,所述对所述输出文本进行评价的步骤,包括:
计算所述输出文本与所述第二文本的相似度;
检测所述输出文本与所述第二文本的词汇数量的差值,并根据所述差值确定所述输出文本对应的惩罚因子;
根据所述相似度及所述惩罚因子得到所述输出文本对应的评价结果。
进一步地,在本申请实施例中,所述将所述待改写文本输入所述双向循环神经网络进行语义识别,得到与所述待改写文本对应的语义编码的步骤,包括:
对待改写文本进行分词处理,得到所述待改写文本包含的多个词汇;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川无声信息技术有限公司,未经四川无声信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910111757.0/2.html,转载请声明来源钻瓜专利网。





