[发明专利]实体标签的抽取方法和装置有效
申请号: | 201510625039.7 | 申请日: | 2015-09-25 |
公开(公告)号: | CN105224642B | 公开(公告)日: | 2019-03-12 |
发明(设计)人: | 罗剑波;李羽;王波;邹晓艺 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F17/27 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 宋合成 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 实体 标签 抽取 方法 装置 | ||
本发明提出一种实体标签的抽取方法和装置,该实体标签的抽取方法包括:从网页中获取用于描述实体间共性的自然语言片段;获取满足所述自然语言片段的实体;将所述自然语言片段作为多实体标签,建立所述多实体标签与所述实体之间的关联关系。该方法能够提高能够描述的实体关系的覆盖范围,并且可以提高描述方式的自然度。
技术领域
本发明涉及数据处理技术领域,尤其涉及一种实体标签的抽取方法和装置。
背景技术
在知识库中,为方便机器理解知识,通常将实体的关系及属性(统称实体关系)映射到架构(Schema)预定义的关系上。借助Schema,机器能准确无歧义地理解知识,但是这种知识表示方式在实际应用中存在以下两个问题:实体关系种类繁多并且会动态变化,预定义关系难以涵盖所有可能的关系,大量知识无法映射到知识库中;预定义关系构造出来的关系描述生硬模式化,缺乏语言美感,难以直接应用到要求语言丰富多彩的产品场景中。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的一个目的在于提出一种实体标签的抽取方法,该方法可以提高能够描述的实体关系的覆盖范围,并且可以提高描述方式的自然度。
本发明的另一个目的在于提出一种实体标签的抽取装置。
为达到上述目的,本发明第一方面实施例提出的实体标签的抽取方法,包括:从网页中获取用于描述实体间共性的自然语言片段;获取满足所述自然语言片段的实体;将所述自然语言片段作为多实体标签,建立所述多实体标签与所述实体之间的关联关系。
本发明第一方面实施例提出的实体标签的抽取方法,通过从网页中获取多实体标签,可以使得实体标签不限于Schema预定义的关系,从而可以提高能够描述的实体关系的覆盖范围,通过将自然语言片段作为多实体标签,可以提高描述方式的自然度。
为达到上述目的,本发明第二方面实施例提出的实体标签的抽取装置,包括:第一获取模块,用于从网页中获取用于描述实体间共性的自然语言片段;第二获取模块,用于获取满足所述自然语言片段的实体;关联模块,用于将所述自然语言片段作为多实体标签,建立所述多实体标签与所述实体之间的关联关系。
本发明第二方面实施例提出的实体标签的抽取装置,通过从网页中获取多实体标签,可以使得实体标签不限于Schema预定义的关系,从而可以提高能够描述的实体关系的覆盖范围,通过将自然语言片段作为多实体标签,可以提高描述方式的自然度。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1是本发明一实施例提出的实体标签的抽取方法的流程示意图;
图2是本发明另一实施例提出的实体标签的抽取方法的流程示意图;
图3是本发明另一实施例提出的实体标签的抽取装置的结构示意图;
图4是本发明另一实施例提出的实体标签的抽取装置的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的模块或具有相同或类似功能的模块。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。相反,本发明的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。
图1是本发明一实施例提出的实体标签的抽取方法的流程示意图,该方法包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510625039.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种网页浏览模式切换方法及电子设备
- 下一篇:一种数据访问方法和装置