[发明专利]电商平台的知识图谱构建方法、装置、设备及存储介质有效
申请号: | 201910007866.8 | 申请日: | 2019-01-04 |
公开(公告)号: | CN109816482B | 公开(公告)日: | 2023-08-29 |
发明(设计)人: | 金戈;徐亮 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06Q30/0601 | 分类号: | G06Q30/0601;G06F16/36 |
代理公司: | 深圳众鼎专利商标代理事务所(普通合伙) 44325 | 代理人: | 黄章辉 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 平台 知识 图谱 构建 方法 装置 设备 存储 介质 | ||
1.一种电商平台的知识图谱构建方法,其特征在于,包括:
根据电商平台上每个用户的历史浏览记录信息整理出所述每个用户的浏览记录字段;
针对所述电商平台上的每个用户,从所述用户的浏览记录字段中选取出词频排行靠前的预设第一数量个字段作为类目字段;
针对每个用户的每个类目字段,计算所述类目字段与其他用户的各个浏览记录字段之间的相似度,并选取出相似度超过预设第一阈值的浏览记录字段作为关联字段,所述其他用户是指所述电商平台上除所述用户以外的用户;
针对每个类目字段,根据所述类目字段、与所述类目字段对应的各个关联字段、以及所述类目字段分别与所述各个关联字段之间的相似度建立三元组,得到所述类目字段对应的类目网络,其中,所述类目字段和与所述类目字段对应的每一关联字段为每一三元组中的两个节点,所述相似度为所述两个节点之间的边;
在得到所述电商平台上所有用户的类目字段对应的类目网络之后,根据所有用户的类目字段对应的类目网络组成所述电商平台的知识图谱。
2.根据权利要求1所述的电商平台的知识图谱构建方法,其特征在于,所述根据电商平台上每个用户的历史浏览记录信息整理出所述每个用户的浏览记录字段包括:
获取电商平台上每个用户的历史浏览记录信息;
对所述每个用户的历史浏览记录信息进行数据清洗;
根据预设的各个无效字段将所述每个用户的历史浏览记录信息中的无效字段剔除;
对剔除无效字段后的所述每个用户的历史浏览记录信息进行字段整理,得到所述每个用户的浏览记录字段。
3.根据权利要求1所述的电商平台的知识图谱构建方法,其特征在于,所述计算所述类目字段与其他用户的各个浏览记录字段之间的相似度包括:
将所述类目字段和其他用户的各个浏览记录字段分别转换为类目词向量和各个字段词向量;
分别计算所述类目词向量与各个所述字段词向量之间的向量距离;
根据计算得到的各个所述向量距离确定所述类目字段与其他用户的各个浏览记录字段之间的相似度,其中,向量距离与相似度负相关。
4.根据权利要求1所述的电商平台的知识图谱构建方法,其特征在于,所述电商平台的知识图谱构建方法还包括:
分别计算所述知识图谱中各个类目字段两两之间的相似度;
将所述各个类目字段中相似度超过预设第二阈值的类目字段所对应的类目网络划分为同一个大类网络。
5.根据权利要求1至4中任一项所述的电商平台的知识图谱构建方法,其特征在于,在根据所有用户的类目字段对应的类目网络组成所述电商平台的知识图谱之后,还包括:
获取目标用户在所述电商平台上最近浏览的预设第二数量条历史浏览记录;
从所述预设第二数量条历史浏览记录中选取出词频排行靠前的预设第三数量个字段作为目标字段;
针对每个所述目标字段,分别计算所述目标字段与所述知识图谱中各个类目字段之间的相似度,并确定相似度最高的类目字段作为目标类目字段;
针对每个所述目标字段,获取所述知识图谱中各个优选关联字段,所述各个优选关联字段是指在与所述目标类目字段以边相连的各个关联字段中,相似度排行靠前的预设第四数量个关联字段;
将获取到的各个所述优选关联字段推送给所述目标用户。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910007866.8/1.html,转载请声明来源钻瓜专利网。