[发明专利]概念驱动的自动分节标识有效
申请号: | 201410483039.3 | 申请日: | 2014-09-19 |
公开(公告)号: | CN104516942B | 公开(公告)日: | 2018-04-17 |
发明(设计)人: | P·E·布兰南;S·R·卡里尔;S·R·麦卡蒂尔;D·J·麦克洛斯基 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/28 |
代理公司: | 北京市金杜律师事务所11256 | 代理人: | 酆迅,辛鸣 |
地址: | 美国纽*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明的各实施例涉及概念驱动的自动分节标识。提供了用于生成用于电子文档的分节元数据的机制。这些机制接收文档并且分析文档以标识在文档的文本内容内存在的概念。机制使在文本内容内的概念相互相关以基于定义有关概念或者概念模式的一个或者多个规则的应用来标识概念组。机制基于在文本内容内的概念的相关性来确定在文本内容内的文本分节。基于该确定的结果,机制生成用于文档的分节元数据并且与文档关联地存储分节元数据以用于由文档处理系统使用。 | ||
搜索关键词: | 概念 驱动 自动 分节 标识 | ||
【主权项】:
一种在包括处理器和存储器的数据处理系统中的用于生成用于电子文档的分节元数据的方法,所述方法包括:由所述数据处理系统接收用于处理的电子文档;由所述数据处理系统分析所述电子文档以标识在所述电子文档的文本内容内存在的概念;由所述数据处理系统使在所述文本内容内的概念相互相关以基于定义有关概念或者概念模式的一个或者多个规则的应用来标识在所述文本内容内的概念组;由所述数据处理系统基于在所述文本内容内的概念的相关性来确定在所述文本内容内的至少一个文本分节;由所述数据处理系统基于所述确定的结果生成用于所述电子文档的分节元数据以由此标识在所述电子文档中的所述至少一个分节;以及由所述数据处理系统,与所述电子文档关联地存储所述分节元数据以用于由文档处理系统使用。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410483039.3/,转载请声明来源钻瓜专利网。
- 上一篇:一种管理数据库日志的方法及装置
- 下一篇:影像笔记方法及系统