[发明专利]实体提取反馈有效
| 申请号: | 201380077066.4 | 申请日: | 2013-05-30 |
| 公开(公告)号: | CN105378706B | 公开(公告)日: | 2018-02-06 |
| 发明(设计)人: | S.布兰奇弗洛维 | 申请(专利权)人: | 朗桑有限公司 |
| 主分类号: | G06F17/27 | 分类号: | G06F17/27 |
| 代理公司: | 中国专利代理(香港)有限公司72001 | 代理人: | 张凌苗,陈岚 |
| 地址: | 英国*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 实体 提取 反馈 | ||
1.一种处理实体提取反馈的计算机实现的方法,所述方法包括:
利用计算系统而生成与文档相关联的所提议的实体提取结果,所提议的实体提取结果基于被应用于文档的规则集而被生成;
利用计算系统而接收关于所提议的实体提取结果的反馈,所述反馈包括在文档中所包括的实际实体以及指示实际实体的文档的特征;
利用计算系统、基于反馈而确定对规则集的所提议的修改;以及
根据对规则集的所提议的修改来修改规则集,其中所述规则集的修改产生修改的规则集,所述修改的规则集指定在文档中搜索实际实体的多个实例以确认要提取的特定实体提取结果。
2.根据权利要求1所述的计算机实现的方法,还包括使得对规则集的所提议的修改被显示给用户,并且响应于接收到用户的确认而应用对规则集的所提议的修改。
3.根据权利要求1所述的计算机实现的方法,其中指示实际实体的文档的特征包括来自文档的内容的一部分。
4.根据权利要求1所述的计算机实现的方法,其中指示实际实体的文档的特征包括与文档相关联的分类。
5.根据权利要求1所述的计算机实现的方法,其中确定对规则集的所提议的修改包括从规则集中识别出影响所提议的实体提取结果的触发的规则,并且当所提议的实体提取结果不匹配实际实体时生成对触发的规则的所提议的改变,对触发的规则的所提议的改变基于指示实际实体的文档的特征而被生成。
6.根据权利要求5所述的计算机实现的方法,还包括使得触发的规则以及对触发的规则的所提议的改变被显示给用户。
7.根据权利要求1所述的计算机实现的方法,其中生成对规则集的所提议的修改包括确定要被添加到规则集的新提议的规则,所述新提议的规则是基于指示实际实体的文档的特征的。
8.根据权利要求1所述的计算机实现的方法,还包括从规则集中识别出影响所提议的实体提取结果的触发的规则,并且使得触发的规则被显示给用户。
9.根据权利要求1所述的计算机实现的方法,还包括从先前分析的文档的语料库中识别出将会受对规则集的所提议的修改影响的其它文档,并且使得通知被显示给用户,所述通知指示所述其它文档。
10.一种实体提取反馈系统,包括:
一个或多个处理器;
在所述一个或多个处理器中的至少一个上执行的实体提取分析器,所述实体提取分析器使用规则集来分析文档以确定与文档相关联的所提议的实体提取结果;以及
在所述一个或多个处理器中的至少一个上执行的规则更新器,所述规则更新器接收关于所提议的实体提取结果的反馈,所述反馈包括与文档相关联的实际实体以及指示实际实体的文档的特征,基于反馈而生成对规则集的所提议的修改,并且根据对规则集的所提议的修改来修改规则集,其中所述规则集的修改产生修改的规则集,所述修改的规则集指定在文档中搜索实际实体的多个实例以确认要提取的特定实体提取结果。
11.根据权利要求10所述的实体提取反馈系统,其中所述规则更新器使得对规则集的所提议的修改被显示给用户,并且响应于接收到用户的确认而用所提议的修改来更新规则集。
12.根据权利要求10所述的实体提取反馈系统,其中所述规则更新器通过从规则集中识别出影响所提议的实体提取结果的触发的规则而生成对规则集的所提议的修改,并且当所提议的实体提取结果不匹配实际实体时生成对触发的规则的所提议的更新,对触发的规则的所提议的更新基于指示实际实体的文档的特征而被生成。
13.根据权利要求12所述的实体提取反馈系统,其中所述规则更新器使得触发的规则和对触发的规则的所提议的更新被显示给用户。
14.根据权利要求10所述的实体提取反馈系统,其中所述规则更新器通过生成要被添加到规则集的新提议的规则而生成对规则集的所提议的修改,所述新提议的规则是基于指示实际实体的文档的特征的。
15.一种存储指令的非暂时性计算机可读存储介质,所述指令在被一个或多个处理器执行时使得所述一个或多个处理器:
生成与文档相关联的所提议的实体提取结果,所提议的实体提取结果基于被应用于文档的规则集而被生成;
接收关于所提议的实体提取结果的反馈,所述反馈包括与文档相关联的实际实体以及与文档相关联的分类;
基于反馈而确定对规则集的所提议的修改;以及
其中所述规则集的修改产生修改的规则集,所述修改的规则集指定在文档中搜索实际实体的多个实例以确认要提取的特定实体提取结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于朗桑有限公司,未经朗桑有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201380077066.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于对社交媒体的用户分类的方法、计算机程序和计算机
- 下一篇:智能选择引擎





