[发明专利]实体向量确定方法及装置,信息检索方法及装置有效

专利信息
申请号: 201810447394.3 申请日: 2018-05-11
公开(公告)号: CN108717407B 公开(公告)日: 2022-08-09
发明(设计)人: 华镇;钟啸林;余婷婷;侯培旭;张弓 申请(专利权)人: 北京三快在线科技有限公司
主分类号: G06F40/295 分类号: G06F40/295;G06F40/30;G06F40/216;G06F16/9532;G06Q30/06
代理公司: 北京润泽恒知识产权代理有限公司 11319 代理人: 莎日娜
地址: 100083 北京市海*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 实体 向量 确定 方法 装置 信息 检索
【说明书】:

本申请实施例公开了一种实体向量确定方法,属于计算机技术领域,解决现有技术中,获取的实体向量不能准确表达实体之间相关性的问题。本申请实施例公开的实体向量确定方法包括:根据预先训练的词向量模型,确定实体的关键词的词向量;将所述实体的所述关键词的词向量以相应的权重进行加权运算,得到所述实体的实体向量。本申请公开的方法,通过对实体的关键词赋予相应的权重,之后,通过对关键词的词向量进行加权计算,得到相应的实体向量,充分考虑了不同关键词对于不同实体特征表达的重要程度和影响,使得确定的实体向量能准确表达实体的特征,准确的体现实体之间相关性。

技术领域

本申请涉及计算机技术领域,特别是涉及一种实体向量确定方法及装置,信息检索方法及装置。

背景技术

随着移动互联网技术的发展,O2O(Online-to-Offline)本地生活化服务,极大的方便了人们的生活。与传统网页平台不同,O2O平台的信息描述载体往往具有多个文本域,从不同的角度尝试对服务进行具体的描述,例如:一个提供具体餐饮服务的商家POI(Pointof Interest),可能会有商家名称、品牌名称、商家所处商圈、商家地址、商家主营菜品,商家评论区的用户原创内容UGC(User Generated Content)等等多个文本域。另外,还有一些不同类型的信息描述载体,如用户写的关于美食类的文章可能也会提到这个商家。这类信息描述载体的文本域有时多达几十个甚至几千个。现有技术中,在信息检索时,主要通过关键词匹配技术,而对于O2O平台的信息描述载体,如果存储信息描述载体的所有文本域,将占用很大的存储空间,同时,检索效率低下,如果只存储关键信息,从而会丢失一部分信息,导致检索准确率降低。

现有技术中,有通过语义向量进行搜索的应用,但是现有技术中直接通过词向量模型或神经网络模型计算关键词的语义向量,仅考虑了关键词的文本相似度,不能准确、全面表达表达实体之间相关性,从而会导致搜索结果不准确。

综上,现有技术中的实体向量确定方法至少存在不能准确、全面表达表达实体之间相关性的缺陷。

发明内容

本申请提供一种实体向量确定方法,至少解决现有技术中获取的实体向量不能准确表达实体之间相关性的问题。

为了解决上述问题,第一方面,本申请实施例提供了一种实体向量确定方法,包括:

根据预先训练的词向量模型,确定实体的关键词的词向量;

将所述实体的所述关键词的词向量以相应的权重进行加权运算,得到所述实体的实体向量。

第二方面,本申请实施例提供了一种信息检索方法包括:

通过本申请实施例公开的实体向量确定方法,确定预设实体的实体向量;

通过局部敏感哈希技术对预设实体的实体向量进行哈希计算,以根据计算得到的哈希值构建索引关系,其中,所述索引关系至少包括:所述哈希值、所述预设实体;

根据所述索引关系中的所述哈希值,确定目标实体的候选实体,其中,所述目标实体和所述候选实体选自于所述预设实体;

根据所述目标实体和所述候选实体的所述实体向量,确定所述目标实体和所述候选实体的相似度,以根据所述相似度确定所述目标实体的信息检索结果。

第三方面,本申请实施例提供了一种实体向量确定装置,包括:

关键词词向量确定模块,用于根据预先训练的词向量模型,确定实体的关键词的词向量;

实体向量确定模块,用于将所述实体的所述关键词的词向量以相应的权重进行加权运算,得到所述实体的实体向量。

第四方面,本申请实施例提供了一种信息检索装置,包括:

实体向量确定模块,用于通过本申请实施例所述的实体向量确定方法确定预设实体的实体向量;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京三快在线科技有限公司,未经北京三快在线科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810447394.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top