[发明专利]基于query分析的图谱优化方法、装置、设备及介质有效
申请号: | 202110688454.2 | 申请日: | 2021-06-22 |
公开(公告)号: | CN113254671B | 公开(公告)日: | 2021-09-28 |
发明(设计)人: | 陈宇 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/28;G06F16/35;G06F40/295;G06N3/04;G06N5/02 |
代理公司: | 深圳市精英专利事务所 44242 | 代理人: | 李翔宇 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 query 分析 图谱 优化 方法 装置 设备 介质 | ||
本发明涉及人工智能领域,提供一种基于query分析的图谱优化方法、装置、设备及介质,能够通过query分析,抽取到用户关注的实体及关系,形成用户关注领域的知识,有效解决了回答不清楚、不准确等的问题,同时,结合query分析及搜索引擎,将与用户关注点强相关的实体及关系更新至知识图谱,使构建的图谱更加具有针对性,进而实现了对知识图谱的优化更新,扩充及丰富了知识图谱的规模。本发明还涉及区块链技术,目标图谱可以存储于区块链节点上。
技术领域
本发明涉及人工智能技术领域,尤其涉及一种基于query分析的图谱优化方法、装置、设备及介质。
背景技术
现有技术中普遍采用的用于构建知识图谱的数据源主要是结构化和半结构化数据,比如金融产品的知识图谱,数据来源一方面是相关公司历史金融产品数据库,另一方面是一些金融专业网站公布的半结构化网页数据。这些数据的优点是比较规整,方便转换成知识图谱。但是,也存在一定的缺陷,具体如下:
1.数据量有限;很多公司的积累数据库是不够的,甚至有些数据并没有存储到数据库中,因此无法支持完整的知识图谱构建;
2.一些数据库由于权限问题无法获取。
因此,传统方式构建的知识图谱不够完整,知识的覆盖面较小。
另外,采用现有技术构建的知识图谱与用户需求的关联度较小,当现有技术构建的知识图谱被用于用户搜索等交互场景时,由于答案反馈主要基于的是数据库数据和知识图谱数据,因此,将可能导致下面问题的产生:
1.由于知识图谱中的数据不够完整,因此回答不详细;
2.由于知识图谱中的数据与用户的关联度较低,因此匹配的答案不准确。
发明内容
本发明实施例提供了一种基于query分析的图谱优化方法、装置、设备及介质,能够通过query分析,抽取到用户关注的实体及关系,形成用户关注领域的知识,有效解决了回答不清楚、不准确等的问题,同时,结合query分析及搜索引擎,将与用户关注点强相关的实体及关系更新至知识图谱,使构建的图谱更加具有针对性,进而实现了对知识图谱的优化更新,扩充及丰富了知识图谱的规模。
第一方面,本发明实施例提供了一种基于query分析的图谱优化方法,其包括:
获取预设时长内产生的query日志;
从所述query日志中获取浏览信息,并根据所述浏览信息确定待优化query;
调用指定搜索引擎,并利用所述指定搜索引擎查询所述待优化query,得到至少一个非结构化文本;
利用改进的BiLSTM模型对所述至少一个非结构化文本进行实体及关系抽取,得到候选实体及候选关系;
从所述至少一个非结构化文本中获取抽取失败的文本,利用改进的基于ERNIE的实体关系联合抽取模型对所述抽取失败的文本进行补充抽取,并将抽取到的数据补充至所述候选实体及所述候选关系;
调用初始知识图谱,并利用所述初始知识图谱对所述候选实体及所述候选关系进行清洗,得到目标实体及目标关系;
将所述目标实体及所述目标关系更新至所述初始知识图谱,得到目标图谱。
根据本发明优选实施例,所述根据所述浏览信息确定待优化query包括:
从所述浏览信息中捕获停留时长大于或者等于配置时长,且没有点击操作的页面,将捕获到的页面所对应的query确定为所述待优化query;及/或
从所述浏览信息中读取用户的消极反馈记录,并获取与所述消极反馈记录对应的query作为所述待优化query。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110688454.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种大容量老化测试箱
- 下一篇:多级变速器及车辆