[发明专利]一种基于关键句和关键字的反向生成摘要的方法在审

专利信息
申请号: 201910281699.6 申请日: 2019-04-09
公开(公告)号: CN109977220A 公开(公告)日: 2019-07-05
发明(设计)人: 舒泓新;蔡晓东;蒋鹏;马新成 申请(专利权)人: 中通服公众信息产业股份有限公司
主分类号: G06F16/34 分类号: G06F16/34
代理公司: 济南智圆行方专利代理事务所(普通合伙企业) 37231 代理人: 张玉琳
地址: 830000 新疆维*** 国省代码: 新疆;65
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明涉及一种基于关键字和关键句的反向生成摘要的方法。方法包括:构建关键字和关键句的训练和测试数据集,搭建序列到序列的框架网络,通过对关键字和关键句进行编码,再有选择注意力模型对需要提取的地方进行定位和选择,若提取的摘要信息在原文中就选择原文,反之就从字典中选取摘要信息,将定位和选择好的内容放入反向解码器中,再经查重模块,最终得到文本摘要。发明的有益效果是:基于关键字和关键句的摘要提取方法使得文档中的冗余信息降低、对原文中重要信息的辨识能力提高、产生的摘要具有对原文的高度概括且符合中文语法,语句更加流畅,语义也更加符合文意。
搜索关键词: 原文 摘要信息 解码器 测试数据集 注意力模型 语义 框架网络 冗余信息 摘要提取 重要信息 辨识 放入 构建 文档 语句 语法 字典 文本 中文
【主权项】:
1.一种基于关键句和关键字的反向生成摘要的方法,其特征在于,包括步骤:S1、将获取的语料生成文档;S2、分别用tf‑idf算法和用textrank算法提取原文的若干个关键字和关键句;S3、用正则表达式比较标准答案与所述S2提取的关键字,将标题中不同的关键字增加到S2提取的关键字中;S4、将获取的所述关键字和关键句分别输入两个编码器中;S5、选择注意力模型在编码器或在字典中寻找形成摘要的关键信息;S6、S5挑选好的关键信息进入反向解码器;S7、用查重模块对注意力模型控制,防止重复定位原文,产生重复字;S8、最终生成文本摘要。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中通服公众信息产业股份有限公司,未经中通服公众信息产业股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201910281699.6/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top