[发明专利]知识图谱生成方法、装置、计算机设备以及存储介质有效
申请号: | 201810828187.2 | 申请日: | 2018-07-25 |
公开(公告)号: | CN110851610B | 公开(公告)日: | 2022-09-27 |
发明(设计)人: | 许瑾;刘文昱;郝萌 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 宋合成 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 知识 图谱 生成 方法 装置 计算机 设备 以及 存储 介质 | ||
本申请提出一种知识图谱生成方法、装置、计算机设备以及存储介质,其中,方法包括:通过对包含多次搜索的搜索会话,获取在搜索会话中用户输入的各搜索词,进而根据各搜索词之间的文本重合情况或各搜索词的句法结构,确定各搜索词之间的语义包含关系,将各搜索词作为知识图谱节点,根据各搜索词之间的语义包含关系,确定各节点之间的父子关系,最终根据父子关系,生成知识图谱。该方法通过用户搜索会话输入的各搜索词,根据各搜索词之间的文本重合情况或各搜索词的句法结构,确定各搜索词之间的语义包含关系,进而生成知识图谱,解决了现有技术中不能准确识别语义包含关系以及通过人工的方式构建知识图谱,导致构建成本高,时间长的技术问题。
技术领域
本申请涉及人工智能技术领域,尤其涉及一种知识图谱生成方法、装置、计算机设备以及存储介质。
背景技术
随着信息技术的不断发展,互联网信息日益丰富。知识图谱的应用使得人工智能得到更好的发展,使人们通过搜索能够找到最想要的信息。知识图谱本质上是语义网络,是一种基于图的数据结构,描述的是真是世界汇总存在的实体以及实体之间的关系。随着知识图谱的应用日益广泛,知识图谱的构建也及其重要。
相关技术中,对知识图谱的构建还处于人工阶段,对于特定领域的构建还需要该领域的专家做大量的人工标注工作,因此,构建成本高,时间也较长。此外,目前的机器学习和自然语言处理技术在语义识别方面也存在较大的难度,不能准确的根据语义包含关系,呈现结构化的知识图谱。
发明内容
本申请旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本申请提出一种知识图谱生成方法,通过用户在搜索会话中输入的各搜索词,根据各搜索词之间的文本重合情况或各搜索词的句法结构,确定各搜索词之间的语义包含关系,据此构建语义包含关系的知识图谱,以解决相关技术中通过人工的方式构建知识图谱,导致构建成本高,时间长的技术问题。
本申请提出一种知识图谱生成装置。
本申请提出一种计算机设备。
本申请提出一种非临时性计算机可读存储介质。
本申请提出一种计算机程序产品。
本申请一方面实施例提出了一种知识图谱生成方法,包括:
对包含多次搜索的搜索会话,获取在所述搜索会话中用户输入的各搜索词;
根据各搜索词之间的文本重合情况或各搜索词的句法结构,确定各搜索词之间的语义包含关系;
将各搜索词作为知识图谱节点,根据各搜索词之间的语义包含关系,确定各节点之间的父子关系;
根据所述父子关系,生成所述知识图谱。
本申请实施例的知识图谱生成方法,通过对包含多次搜索的搜索会话,获取在搜索会话中用户输入的各搜索词;根据各搜索词之间的文本重合情况或各搜索词的句法结构,确定各搜索词之间的语义包含关系;将各搜索词作为知识图谱节点,根据各搜索词之间的语义包含关系,确定各节点之间的父子关系;根据父子关系,生成知识图谱。该方法通过用户搜索会话中输入的各搜索词,根据各搜索词之间的文本重合情况或各搜索词的句法结构,确定各搜索词之间的语义包含关系,进而生成知识图谱,解决了现有技术中不能准确识别语义包含关系以及通过人工的方式构建知识图谱,导致构建成本高,时间长的技术问题。
本申请又一方面实施例提出了一种知识图谱生成装置,包括:
获取模块,用于对包含多次搜索的搜索会话,获取在所述搜索会话中用户输入的各搜索词;
确定模块,用于根据各搜索词之间的文本重合情况或各搜索词的句法结构,确定各搜索词之间的语义包含关系;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810828187.2/2.html,转载请声明来源钻瓜专利网。