[发明专利]用于识别对话中所提及的人的方法和装置无效

专利信息
申请号: 201210201517.8 申请日: 2012-06-15
公开(公告)号: CN103514165A 公开(公告)日: 2014-01-15
发明(设计)人: 黄耀海;李荣军;胡钦谙 申请(专利权)人: 佳能株式会社
主分类号: G06F17/30 分类号: G06F17/30;G10L15/26
代理公司: 中国国际贸易促进委员会专利商标事务所 11038 代理人: 马景辉
地址: 日本*** 国省代码: 日本;JP
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用于 识别 对话 提及 方法 装置
【说明书】:

技术领域

本发明涉及用于识别对话中所提及的人的方法和装置,更具体地说,涉及能够在自然语言处理中准确识别所提及的人的人名实体的方法和装置。

背景技术

随着计算机技术的发展,存在自动识别对话中人的姓名的需要。通常,一个对话中的各个人名可以分成所提及的人名(Mentioned Person Name,MPN)和未提及的人名(Non-Mentioned Person Name,NMPN)。本文中,所提及的人名是指在对话的交谈期间被提及的人的姓名,而未提及的人名是指在对话的上下文中、但是没有在交谈期间提及的人的姓名。为了使这些术语更清楚,图1示出了会议记录的一个示例。该会议记录是对话的一个例子。如图1所示,会议记录中包含两个出席者,一个是IT部门经理David Hill,另一个是本地化部门经理Alex Bell。此外,在Hill发言期间,提到了第三个人的姓名,即Lee。在这个例子中,在对话前面的姓名“Bell”和“Hill”被称作未提及的人名(NMPN),因为他们都没有出现在对话中。姓名“Lee”被称作所提及的人名(MPN),因为Hill在发言中提到了该名字。

如图1的例子所示,通常很容易识别出NMPN的身份。以“Hill”为例,可以很容易识别出位于对话之前的术语“Hill”。由于“Hill”已经被列为出席者,从而可以搜索出席者的名单以寻找匹配,所以可以很容易识别出“Hill”是IT部门经理“David Hill”。此外,能够从以上信息中确定“David Hill”的唯一的标识符。这里的标识符可以是例如,分配给公司的每个雇员的唯一的ID。另一方面,很难识别“Lee”的身份,因为“Lee”仅仅由Hill提及并且可能并没有被列为出席者,所以可能有许多人的名字都叫“Lee”。

过去,已经有用于识别人名的技术。例如,在美国专利(US7,685,201B2)中描述了使用基于姓名实体提取的分类的用于人物消歧的技术,该技术使得能够清楚区分具有相同姓名的不同人。姓名实体提取定位搜索结果中的人名的一定距离内的词(条目)。这些条目用于对对应于具有相同姓名的不同人的搜索结果消歧,例如,位置信息、组织信息、职业信息和/或合伙人信息等。在一个示例中,每个人被表示成一个向量,并且基于与一个人的条目的接近程度和/或条目的类型对应的权重来计算各个向量之间的相似度。然后,基于相似度的数据,把表示同一个人的人物向量合并到一个类中,使得各个类(以较高的概率)只表示不同的人。

此外,美国专利申请公开US2007/0233656A1描述了一种命名实体消歧的方法,其中使用消歧分数模型来在搜索结果和其它上下文中对命名实体消歧。通过使用文献的知识库(包括关于命名实体的文献)来开发该分数模型。知识库的各个方面,例如文献题目、重定向页面、消歧页面、超链接以及类别等,都可以用来开发该分数模型。

但是,上面介绍的现有技术不能足够准确地识别被提及的人(即所提及的人)。在许多情况下,不能唯一地识别所提及的人。在应用上述各个方法之后仍然有多个识别符(每个识别符对应一个唯一的人)。

发明内容

本发明的目的之一是解决上述问题中的至少一个。

根据本发明的一个实施例,提供了一种用于识别对话中所提及的人的方法,包括:识别与从所述对话获取的所提及的人名相关的至少一个人名实体;获取与所提及的人名相关的一组候选标识符;从内部资源和外部资源为每个候选标识符获取至少一个关系特征,其中所述关系特征表示所述候选标识符与所述至少一个人名实体之间的关系;以及基于所述至少一个关系特征,从该组候选标识符中选择一个标识符作为所提及的人名的标识符。其中所述关系特征优选包括以下至少一种:等级差距特征,表示两个人的等级之间的差距;熟悉度特征,表示两个人之间的熟悉程度;历史称呼特征,表示在两个人间已经使用过的称呼;以及上下文关系特征,表示对话中两个人的关系。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于佳能株式会社,未经佳能株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210201517.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top