[发明专利]一种类型关系的获取方法及装置有效
| 申请号: | 201510900876.6 | 申请日: | 2015-12-09 |
| 公开(公告)号: | CN105550253B | 公开(公告)日: | 2021-02-12 |
| 发明(设计)人: | 葛宁 | 申请(专利权)人: | 上海优扬新媒信息技术有限公司 |
| 主分类号: | G06F16/583 | 分类号: | G06F16/583;G06F16/903;G06F16/28 |
| 代理公司: | 北京鸿德海业知识产权代理有限公司 11412 | 代理人: | 袁媛 |
| 地址: | 201210 上海市嘉*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 类型 关系 获取 方法 装置 | ||
本发明实施例提供了一种类型关系的获取方法及装置。一方面,本发明实施例通过获得各实体以及各实体的描述文本;从而,获得各实体对应的类型,以及,根据每个类型对应的各实体的描述文本,生成每个类型的描述文本;进而,根据指定的类型关系,从每个类型的描述文本中抽取符合所述指定的类型关系的M组类型,M为正整数。因此,本发明实施例提供的技术方案能够自动获得实体的类型与类型之间的关系,提高了实体的类型与类型之间的关系的获取效率,降低了实体的类型与类型的关系的获取成本。
【技术领域】
本发明涉及互联网应用技术领域,尤其涉及一种类型关系的获取方法及装置。
【背景技术】
知识图谱中主要包含实体以及实体与实体之间的关系,因此获得两个实体之间的关系是构建和完善知识图谱必不可少的步骤。现有技术中,可以根据实体的类型以及类型间关系,挖掘出更多的实体以及实体间关系,以实现不断完善知识图谱。
现有技术中,类型与类型之间的关系需要人工采集并添加到知识图谱中,人工采集方式主要依赖经验知识进行人工收集和分析,对人员的知识水平要求比较高,而且人工采集过程也比较繁琐复杂,因此,这种人工采集类型间关系的方式获取效率比较低,获取成本比较高。
【发明内容】
有鉴于此,本发明实施例提供了一种类型关系的获取方法及装置,能够自动获得实体的类型与类型之间的关系,提高了实体的类型与类型之间的关系的获取效率,降低了实体的类型与类型的关系的获取成本。
本发明实施例的一方面,提供一种类型关系的获取方法,包括:
获得各实体以及各实体的描述文本;
获得各实体对应的类型;
根据每个类型对应的各实体的描述文本,生成每个类型的描述文本;
根据指定的类型关系,从每个类型的描述文本中抽取符合所述指定的类型关系的M组类型,M为正整数。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述获得各实体对应的类型,包括:
根据类型分类知识,并按照类型对各实体进行聚合,以获得各实体对应的类型;或者,
将各实体分别输入类型分类模型,以使得类型分类模型对各实体进行类型分类,以获得各实体对应的类型。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述根据每个类型对应的各实体的描述文本,生成每个类型的描述文本,包括:
对每个类型对应的各实体的描述文本进行切词处理,以获得切词结果;
利用类型知识库在各切词结果中进行匹配;
若一个切词结果中包含所述类型知识库中定义的关键词,提取包含该切词结果的文本片段;
根据提取到的各文本片段,生成每个类型的描述文本。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述根据指定的类型关系,从每个类型的描述文本中抽取符合所述指定的类型关系的M组类型,包括:
获得指定的关系模板,所述关系模板对应一个类型关系,所述关系模板包括指示两个类型之间的类型关系的文本内容;
利用所述关系模板,在每个类型的描述文本中进行字符匹配,从每个类型的描述文本中抽取出N组类型;N大于或者等于M,且为正整数;
根据抽取出的N组类型,获得符合所述指定的类型关系的M组类型。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述根据抽取出的N组类型,获得符合所述指定的类型关系的M组类型,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海优扬新媒信息技术有限公司,未经上海优扬新媒信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510900876.6/2.html,转载请声明来源钻瓜专利网。





