[发明专利]一种基于关键句和关键字的反向生成摘要的方法在审
申请号: | 201910281699.6 | 申请日: | 2019-04-09 |
公开(公告)号: | CN109977220A | 公开(公告)日: | 2019-07-05 |
发明(设计)人: | 舒泓新;蔡晓东;蒋鹏;马新成 | 申请(专利权)人: | 中通服公众信息产业股份有限公司 |
主分类号: | G06F16/34 | 分类号: | G06F16/34 |
代理公司: | 济南智圆行方专利代理事务所(普通合伙企业) 37231 | 代理人: | 张玉琳 |
地址: | 830000 新疆维*** | 国省代码: | 新疆;65 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于关键字和关键句的反向生成摘要的方法。方法包括:构建关键字和关键句的训练和测试数据集,搭建序列到序列的框架网络,通过对关键字和关键句进行编码,再有选择注意力模型对需要提取的地方进行定位和选择,若提取的摘要信息在原文中就选择原文,反之就从字典中选取摘要信息,将定位和选择好的内容放入反向解码器中,再经查重模块,最终得到文本摘要。发明的有益效果是:基于关键字和关键句的摘要提取方法使得文档中的冗余信息降低、对原文中重要信息的辨识能力提高、产生的摘要具有对原文的高度概括且符合中文语法,语句更加流畅,语义也更加符合文意。 | ||
搜索关键词: | 原文 摘要信息 解码器 测试数据集 注意力模型 语义 框架网络 冗余信息 摘要提取 重要信息 辨识 放入 构建 文档 语句 语法 字典 文本 中文 | ||
【主权项】:
1.一种基于关键句和关键字的反向生成摘要的方法,其特征在于,包括步骤:S1、将获取的语料生成文档;S2、分别用tf‑idf算法和用textrank算法提取原文的若干个关键字和关键句;S3、用正则表达式比较标准答案与所述S2提取的关键字,将标题中不同的关键字增加到S2提取的关键字中;S4、将获取的所述关键字和关键句分别输入两个编码器中;S5、选择注意力模型在编码器或在字典中寻找形成摘要的关键信息;S6、S5挑选好的关键信息进入反向解码器;S7、用查重模块对注意力模型控制,防止重复定位原文,产生重复字;S8、最终生成文本摘要。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中通服公众信息产业股份有限公司,未经中通服公众信息产业股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910281699.6/,转载请声明来源钻瓜专利网。