[发明专利]知识图谱的生成方法、装置、终端以及存储介质在审
申请号: | 201911156483.3 | 申请日: | 2019-11-22 |
公开(公告)号: | CN112836057A | 公开(公告)日: | 2021-05-25 |
发明(设计)人: | 陈开济 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36 |
代理公司: | 深圳中一联合知识产权代理有限公司 44414 | 代理人: | 左婷兰 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 知识 图谱 生成 方法 装置 终端 以及 存储 介质 | ||
本申请适用于人工智能技术领域,提供了一种基于人工智能(Artificial Intelligence,AI)的知识图谱的生成方法、装置、终端以及存储介质,该方法包括:确定目标实体的各个别名名称在目标语言的译名名称,并根据所述别名名称以及所述译名名称,生成所述目标实体的转译关系;通过预设的语料库,分别生成所述目标实体内各个所述别名名称的共现关系;根据所有所述目标实体对应的所述转译关系以及所述共现关系,构建知识图谱。本申请提供的技术方案能够构建支持多语言的知识图谱,并提高了知识图谱内每个知识节点的联想能力,知识图谱的广度以及深度,从而提高了人工智能输出结果的准确性,提升服务响应质量。
技术领域
本申请属于人工智能技术领域,尤其涉及基于人工智能(ArtificialIntelligence,AI)的知识图谱的生成方法、装置、终端以及存储介质。
背景技术
知识图谱,又称为语义网络,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。伴随着信息化技术的发展,采用知识图谱的方式作为载体将多样知识资源进行汇聚,为人工智能的决策提供知识参考,因此,知识图谱中各个知识资源的深度以及准确度,则直接影响人工智能处理结果的准确性。现有的知识图谱的生成方法,主要是基于单一语言构建,不同语言之间的知识图谱相互独立,从而降低了知识图谱的深度,在使用其他语言作为人工智能的输入时,会大大降低处理结果的准确率,影响服务响应质量。
本申请实施例提供了一种知识图谱的生成方法、装置、终端以及存储介质,可以解决现有的知识图谱的生成技术,在处理不同的车辆服务请求时均交由相同的服务器进行处理,容易导致处理逻辑冲突,增加了服务响应的时长以及降低了服务响应的成功率的问题。
第一方面,本申请实施例提供了一种知识图谱的生成方法,包括:
确定目标实体的各个别名名称在目标语言的译名名称,并根据所述别名名称以及所述译名名称,生成所述目标实体的转译关系;
通过预设的语料库,分别生成所述目标实体内各个所述别名名称的共现关系;
根据所有所述目标实体对应的所述转译关系以及所述共现关系,构建知识图谱。
示例性的,根据别名名称对应的共现关系,统计别名名称关联的各个共现实体的出现次数,并基于出现次数选取出高频共现实体,通过基于人工智能的自然语言生成算法(Natural Language Generation,NLG)将别名名称与各个高频共现实体组合,得到源语言语句。
在第一方面的一种可能的实现方式中,所述确定目标实体的各个别名名称在目标语言的译名名称,并根据所述别名名称以及所述译名名称,生成所述目标实体的转译关系,包括:
分别获取包含各个所述别名名称的源语言语句;
根据源语言与所述目标语言之间的翻译模型,输出各个所述源语言语句对应的目标语言语句;
分别从各个所述目标语言语句提取所述别名名称在所述目标语言下的所述译名名称;
建立所述别名名称以及所述译名名称之间的所述转译关系。
在第一方面的一种可能的实现方式中,所述分别获取包含各个所述别名名称的源语言语句,包括:
根据所述目标实体的实体类型,获取与所述实体类型关联的语句模板;
将各个所述别名名称导入所述语句模板,生成所述源语言语句。
示例性地,若语句模板的个数为多个,则可以基于随机分配算法,为每个别名名称配置一个语句模板,从而生成了多个源语言语句。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911156483.3/2.html,转载请声明来源钻瓜专利网。