[发明专利]一种引文自动标引方法无效
| 申请号: | 200910061711.9 | 申请日: | 2009-04-21 |
| 公开(公告)号: | CN101539904A | 公开(公告)日: | 2009-09-23 |
| 发明(设计)人: | 沈阳;沈劲枝;田晨耕 | 申请(专利权)人: | 武汉大学 |
| 主分类号: | G06F17/24 | 分类号: | G06F17/24;G06F17/30 |
| 代理公司: | 武汉天力专利事务所 | 代理人: | 严 彦;冯卫平 |
| 地址: | 43007*** | 国省代码: | 湖北;42 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 引文 自动 标引 方法 | ||
1.一种引文自动标引方法,其特征是:包括以下步骤,
步骤1,对提交文档进行切割得到文本块,对文本块提取特征词句串或信息指纹; 然后将特征词句串或信息指纹提交给检索引擎;
步骤2,对于被提交的特征词句串或信息指纹,当检索引擎返回与特征词句串或 信息指纹相应的检索结果时,记录检索结果作为相应文本块的引文出处,并记 录文本块在文档中的终止位置,记录文本块的引文出处与终止位置的关联关系;
步骤3,结合提交文档中已有引用标引和检索结果去除重复的引文出处后,按照 在提交文档中的位置前后关系对所有引文出处排序后进行标引;
所述结合提交文档中已有引用标引和检索结果去除重复的引文出处具体实 现方式如下,
从提交文档中提取已有引用标引的相关信息,与步骤2所得检索结果的相关信 息比较,所述已有引用标引的相关信息包括已有引用标引的引用标记位置、引 文出处、引用标记位置和引文出处的关联关系,所述检索结果的相关信息即文 本块在文档中的终止位置、文本块的引文出处,以及文本块的引文出处与终止 位置的关联关系;
当出现重复的引文出处时,根据引用标记位置和引文出处的关联关系或文本块 的引文出处和终止位置的关联关系,查到与引文出处相应的已有引用标引的引 用标记位置或文本块在文档中的终止位置,保留位置在提交文档内最前的一条 引文出处,其它重复的引文出处去除;
所述按照在提交文档中的位置前后关系对所有引文出处排序后,进行标引 的具体实现方式如下,
在文档中按照排序在已有引用标引的引用标记位置或文本块的终止位置添加引 用标记,并根据引用标记位置和引文出处的关联关系或文本块的引文出处与终 止位置的关联关系将引文出处添加到提交文档中。
2.根据权利要求1所述的引文自动标引方法,其特征是:当步骤1中将信息指 纹提交给检索引擎时,采用字符串刚性匹配技术对信息指纹进行检索,在步骤2 中记录信息指纹相符的检索结果作为相应文本块的引文出处。
3.根据权利要求1所述的引文自动标引方法,其特征是:当步骤1中将特征词 句串提交给检索引擎时,采用字符串柔性匹配技术或字符串信息相关性技术对 特征词句串进行检索,在步骤2中仅记录相关性高于预设相关阈值的检索结果 作为相应文本块的引文出处。
4.根据权利要求3所述的引文自动标引方法,其特征是:记录文本块在文档中 的起始位置;当检索引擎返回有与步骤1所提交特征词句串相关性高于预设相 符阈值的检索结果时,根据文本块在文档中的起始位置和终止位置,在提交文 档中为该文本块加上引用符号。
5.根据权利要求1或2或3或4所述的引文自动标引方法,其特征是:在执行 步骤3之前,通过人机界面向用户提供三种逻辑跳转,包括标注文本块、修改 文本块以及删除文本块;当用户选择标注文本块时,允许执行步骤3。
6.根据权利要求5所述的引文自动标引方法,其特征是:在步骤2中,记录文 本块在文档中的起始位置;当用户选择修改文本块时,不允许执行步骤3,根据 文本块在文档中的起始位置和终止位置,将该文本块在提交文档中突出显示供 用户修改,并在用户修改保存后返回至步骤1,基于修改后的文本块重新进行自 动标引。
7.根据权利要求5所述的引文自动标引方法,其特征是:在步骤2中,记录文 本块在文档中的起始位置;当用户选择删除文本块时,不允许执行步骤3,根据 文本块在文档中的起始位置和终止位置,从提交文档中自动删除该文本块。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910061711.9/1.html,转载请声明来源钻瓜专利网。





