[发明专利]一种引文自动标引方法无效
| 申请号: | 200910061711.9 | 申请日: | 2009-04-21 |
| 公开(公告)号: | CN101539904A | 公开(公告)日: | 2009-09-23 |
| 发明(设计)人: | 沈阳;沈劲枝;田晨耕 | 申请(专利权)人: | 武汉大学 |
| 主分类号: | G06F17/24 | 分类号: | G06F17/24;G06F17/30 |
| 代理公司: | 武汉天力专利事务所 | 代理人: | 严 彦;冯卫平 |
| 地址: | 43007*** | 国省代码: | 湖北;42 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明提供了一种引文自动标引方法,其特征是包括以下步骤:步骤1,对提交文档进行切割得到文本块,对文本块提取特征词句串或信息指纹;然后将特征词句串或信息指纹提交给检索引擎;步骤2,对于被提交的特征词句串或信息指纹,当检索引擎返回与特征词句串或信息指纹相应的搜索结果时,记录搜索结果作为相应文本块的引文出处,并记录文本块在文档中的终止位置,记录文本块的引文出处与终止位置的关联关系;步骤3,结合提交文档中已有引用标引和搜索结果去除重复的引文出处后,按照在提交文档中的位置前后关系对所有引文出处排序后进行标引。本发明克服了现有手工方法效率十分低下的弱点,提高了标引速度和准确性。 | ||
| 搜索关键词: | 一种 引文 自动 标引 方法 | ||
【主权项】:
1.一种引文自动标引方法,其特征是:包括以下步骤,步骤1,对提交文档进行切割得到文本块,对文本块提取特征词句串或信息指纹;然后将特征词句串或信息指纹提交给检索引擎;步骤2,对于被提交的特征词句串或信息指纹,当检索引擎返回与特征词句串或信息指纹相应的检索结果时,记录检索结果作为相应文本块的引文出处,并记录文本块在文档中的终止位置,记录文本块的引文出处与终止位置的关联关系;步骤3,结合提交文档中已有引用标引和检索结果去除重复的引文出处后,按照在提交文档中的位置前后关系对所有引文出处排序后进行标引;所述结合提交文档中已有引用标引和检索结果去除重复的引文出处具体实现方式如下,从提交文档中提取已有引用标引的相关信息,与步骤2所得检索结果的相关信息比较,所述已有引用标引的相关信息包括已有引用标引的引用标记位置、引文出处、引用标记位置和引文出处的关联关系,所述检索结果的相关信息即文本块在文档中的终止位置、文本块的引文出处,以及文本块的引文出处与终止位置的关联关系;当出现重复的引文出处时,根据引用标记位置和引文出处的关联关系或文本块的引文出处和终止位置的关联关系,查到与引文出处相应的已有引用标引的引用标记位置或文本块在文档中的终止位置,保留位置在提交文档内最前的一条引文出处,其它重复的引文出处去除;所述按照在提交文档中的位置前后关系对所有引文出处排序后,进行标引的具体实现方式如下,在文档中按照排序在已有引用标引的引用标记位置或文本块的终止位置添加引用标记,并根据引用标记位置和引文出处的关联关系或文本块的引文出处与终止位置的关联关系将引文出处添加到提交文档中。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200910061711.9/,转载请声明来源钻瓜专利网。





