[发明专利]一种基于数据重构的文档摘要提取方法有效
申请号: | 201210293118.9 | 申请日: | 2012-08-17 |
公开(公告)号: | CN102841940A | 公开(公告)日: | 2012-12-26 |
发明(设计)人: | 陈纯;卜佳俊;何占盈;王灿;李平 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 杭州天正专利事务所有限公司 33201 | 代理人: | 王兵;黄美娟 |
地址: | 310027 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 基于数据重构的文档摘要提取方法,从文档数据库中获取文档,作为待提取摘要的目标文档;针对每个目标文档,提取该文档中的每一个句子,作为该文档摘要的备选句子库;统计所有关键词在所有文档中的权重信息,并以此将备选句子库中的每个句子表示成一个向量;利用数据重构算法,从备选句子库中挑选出既包含文档中心思想又包含最少冗余信息的最优摘要句子;将挑选的句子提取出来,组成该目标文档的摘要。本方法的优点在于:可以帮助用户,尤其是视觉障碍的残疾人用户,以包含较少文字的摘要的形式快速了解原文档的主要内容。 | ||
搜索关键词: | 一种 基于 数据 文档 摘要 提取 方法 | ||
【主权项】:
一种基于数据重构的文档摘要提取方法,该方法的特征在于:1)从文档数据库中获取文档,作为待提取摘要的目标文档;2)针对每个目标文档,提取该文档中的每一个句子,作为该文档摘要的备选句子库;3)统计所有关键词在所有文档中的权重信息,并以此将备选句子库中的每个句子表示成一个向量;4)利用数据重构算法,从备选句子库中挑选出既包含文档中心思想又包含最少冗余信息的最优摘要句子;5)将挑选的句子提取出来,组成该目标文档的摘要。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210293118.9/,转载请声明来源钻瓜专利网。
- 上一篇:一种防卡件的离子水清洗机
- 下一篇:一种用于疏通LED点胶机针头的夹具
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置