[发明专利]文档信息选择方法和计算机程序产品无效
| 申请号: | 200880132414.2 | 申请日: | 2008-12-19 |
| 公开(公告)号: | CN102257490A | 公开(公告)日: | 2011-11-23 |
| 发明(设计)人: | T.雷;M.G.德瓦多斯;S.马朱姆达 | 申请(专利权)人: | 惠普开发有限公司 |
| 主分类号: | G06F17/27 | 分类号: | G06F17/27 |
| 代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 刘金凤;王洪斌 |
| 地址: | 美国德*** | 国省代码: | 美国;US |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 文档 信息 选择 方法 计算机 程序 产品 | ||
背景技术
诸如大型数据库和因特网的可扩展计算机系统的引入已经显著地提高了数字信息的易访问性。如今,这样的系统的用户可以访问来自各种各样的不同源的大量信息。然而,这一改进并不是不存在问题。
例如,在这样的数字信息系统中尝试找到正确的信息可能远非是普通的任务。尽管可以限定查询来搜索这样的信息系统,然而将该查询限定为使得该查询产生均与所限定的搜索标准相关的仅几个电子文档是非常难的。电子文档可以是利用诸如MS Word和Acrobat等的文字处理程序所创建的单个文件,或者可以是能够从因特网上的特有URL获取到的信息。
因此,这样的信息系统的用户多半会面对不得不搜索大量电子文档以找到和获取感兴趣的信息的艰难任务。
已经进行了大量的努力来为这样的信息系统的用户提供被认为是作为查询结果的更简洁的文档集以找到感兴趣的信息,诸如其中根据特殊词语在电子文档中的出现次数与从所谓的加权词语词典中检索到的加权因子的组合来计算该电子文档关于搜索词的相关性的搜索算法。不利的是,这可能仍需要用户检查大量的文档。
附图说明
以更详细的方式并且利用参考附图的非限制性的示例说明本发明的实施例,其中:
图1示意性地示出本发明的方法的实施例的原理;
图2示意性地示出本发明的方法的实施例的流程图;
图3示意性地示出本发明的方法的实施例的一个方面的流程图;以及
图4示意性地示出根据本发明的实施例的数据处理系统。
具体实施方式
应当理解的是,附图仅是示意性的,并且不是按比例绘制的。还应当理解的是,贯穿附图使用相同的附图标记来表示相同或相似的部件。
图1提供本发明的数据处理系统100的实施例的概念性概况图。在概况图100中,电子文档112的数据库110是可用的。数据库110可以是专有数据库、万维网(WWW)或任何其它适当的信息源。电子文档112每个均包括按语义构造的信息部分。可以诸如以标识该信息部分的语义语境的元数据的形式而明确地包括该语义构成。下面给出了这样的元数据的非限制性示例:
* 语义部分名称
●子部分1
-页
-开始行
-结束行
●子部分2
-页
-开始行
-结束行
●子部分3
-页
-开始行
-结束行
在该示例中,语义部分包括多个子部分,以表示语义信息可以具有分级结构。显然,在非分级语义信息的情况下,语义描述符例如可以采用以下形式:
* 语义部分名称
-页
-开始行
-结束行
电子文档112可以包含分级的语义描述符和非分级的语义描述符这两者,这两者可以通过任何适当的解析策略而被识别。应当理解的是,电子文档112可以具有相同或不同的格式,诸如.txt、.doc、.pdf、.html和.xml文件等。可以使用任何适当的格式将电子文档112中的语义描述符存储在诸如头文件的相关联的电子文档中。这样的格式的已知示例包括万维网本体语言(Web Ontology Language)、资源描述框架模式(Resource Description Framework Schema)和XML模式。
数据处理系统100还包括语义信息处理层120,其被布置为在数据处理系统100的用户请求来自数据库110的信息时访问数据库110中的各个文档112。语义信息处理层120可以包括被布置为实现本发明的方法的软件程序产品,如稍后将更详细地说明的那样。语义信息处理层120被配置为从电子文档112中提取语义描述符,并且将所提取出的描述符显示给数据处理系统100的用户,以允许该用户从电子文档112中选择感兴趣的信息部分。
在一个实施例中,所提取出的描述符可以以列表的形式被呈现,其中,用户可以从该列表中选择感兴趣的信息部分。在另一实施例中,所提取出的语义描述符可以以树130的形式被呈现,其中,在该树130中,树叶表示语义描述符,并且树叶之间的节点表示语义描述符之间的分级关系和/或语义描述符在电子文档112中的次序。用户可以例如通过在显示器上将光标指向感兴趣的树叶并点击鼠标按钮或键盘上的某些按键来选择感兴趣的树叶。在图1中,所选择的树叶已被标记为132,并且未被选择的树叶已被标记为134。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于惠普开发有限公司,未经惠普开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200880132414.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于TC4与718钢的超声波复合电阻焊方法
- 下一篇:等离子体处理装置
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置





