[发明专利]用于自动概括电子文档的内容的方法和装置有效
| 申请号: | 201280049625.6 | 申请日: | 2012-09-11 |
| 公开(公告)号: | CN103874994B | 公开(公告)日: | 2017-09-08 |
| 发明(设计)人: | 因德吉特·玛尼;欧金尼奥·西乌拉娜;尼古拉斯·D·阿洛伊西奥·蒙蒂勒;巴特·K·斯旺森 | 申请(专利权)人: | 雅虎控股公司 |
| 主分类号: | G06F17/21 | 分类号: | G06F17/21 |
| 代理公司: | 北京东方亿思知识产权代理有限责任公司11258 | 代理人: | 李晓冬 |
| 地址: | 美国加利*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 一种用于概括电子文档的方法的一个实施例,包括将电子文档分割为多个项,其中多个项中的每一个与相应长度、相应信息量得分和相应一致性得分相关联;自动地选择多个项的子集,以使得该子集的聚合信息量得分最大化而该子集的聚合长度小于或等于最大长度;以及将该子集安排为电子文档的概要。 | ||
| 搜索关键词: | 用于 自动 概括 电子 文档 内容 方法 装置 | ||
【主权项】:
一种用于概括电子文档的方法,所述方法包括:生成所述电子文档的特征向量,其中所述特征向量包括所述电子文档的多个特征;对所述多个特征中的每一个分配权重;根据分配给所述多个特征中的每一个的所述权重来向所述电子文档分配可概括性得分,其中所述可概括性得分指示所述电子文档是否可概括;以及确定所述电子文档是可概括的时:将所述电子文档分割为多个项,其中所述多个项中的每一个与相应长度、相应信息量得分和相应一致性得分相关;自动地选择所述多个项的子集,以使得所述子集的聚合信息量得分最大化而所述子集的聚合长度小于或等于最大长度;以及将所述子集安排为所述电子文档的概要。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于雅虎控股公司,未经雅虎控股公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201280049625.6/,转载请声明来源钻瓜专利网。
- 上一篇:高压架空线路地线抽能供电技术
- 下一篇:气体放电管电路保护装置





