[发明专利]一种目标物品的匹配方法和装置、电子设备及存储介质在审
申请号: | 202210867880.7 | 申请日: | 2022-07-21 |
公开(公告)号: | CN115115001A | 公开(公告)日: | 2022-09-27 |
发明(设计)人: | 温晓康 | 申请(专利权)人: | 中国平安人寿保险股份有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F16/9535;G06F16/2458 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 余凯欢 |
地址: | 518000 广东省深圳市福田区福田街道益田路5033号平安*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 目标 物品 匹配 方法 装置 电子设备 存储 介质 | ||
本申请实施例提供了一种目标物品的匹配方法和装置、电子设备及存储介质,属于人工智能技术领域。该方法包括获取第一行为数据;根据用户标识对所述第一行为数据进行聚合,得到所述用户标识对应的行为序列;根据所述行为序列中所包含的第一目标物品,构建物品二元组;统计确定所述物品二元组的出现频率,根据所述出现频率,通过对数似然比计算确定所述物品二元组的相似度;根据所述相似度以及所述第一目标物品进行匹配得到第二目标物品。本申请实施例能够减少数据预处理的流程,简化步骤流程从而提高处理效率,可以使得相似度的计算过程更为方便且计算复杂度也有所降低。
技术领域
本申请涉及人工智能技术领域,尤其涉及一种目标物品的匹配方法和装置、电子设备及存储介质。
背景技术
随着移动互联网的快速发展,数据规模化地持续暴增,推荐系统作为一项解决信息过载的关键技术,能够帮助挖掘目标数据的核心潜在价值,为目标对象精准推荐个性化的内容,甚至挖掘目标对象深层次的潜在需求。
在相关技术方案中,推荐系统中计算物品间的相似度,包括但不限于余弦夹角cos、欧几里德距离、以及皮尔森相关系数等计算方式。在这些相关技术方案所提供的相似度计算方法中,通常需要先通过用户历史行为序列计算出物品的向量,再利用向量计算物品之间的相似度,缺点在于当物品数量较大时计算复杂度会很大,且对于热门内容需要进行适当降权。也就是说,相关技术方案中针对相似物品的推荐方法,或者是针对物品之间相似度的计算方法,通常存在着计算过程较为复杂,占用大量计算资源并且需要进行降权操作等复杂预处理流程的弊端。
发明内容
本申请实施例的主要目的在于提出一种目标物品的匹配方法和装置、电子设备及存储介质,旨在提高物品推荐的准确性,同时提高相似度计算处理过程的效率。
为实现上述目的,本申请实施例的第一方面提出了一种目标物品的匹配方法,所述方法包括:
获取第一行为数据;
根据用户标识对所述第一行为数据进行聚合,得到所述用户标识对应的行为序列;
根据所述行为序列中所包含的第一目标物品,构建物品二元组;
统计确定所述物品二元组的出现频率,根据所述出现频率,通过对数似然比计算确定所述物品二元组的相似度;
根据所述相似度以及所述第一目标物品进行匹配得到第二目标物品。
在一些实施例中,在根据所述相似度以及所述第一目标物品进行匹配得到第二目标物品这一步骤之后,所述方法还包括以下步骤:
根据所述相似度对所述第二目标物品进行排序,得到相似物品序列;
根据预设第一阈值对所述相似物品序列进行筛选,得到候选物品序列;
获取第二行为数据,根据所述第二行为数据中的物品信息,关联至所述候选物品序列,并将所述候选物品序列进行可视化展示。
在一些实施例中,所述根据所述行为序列中所包含的第一目标物品,构建物品二元组这一步骤,包括:
构建所述第一目标物品的第一集合,并构建第二集合;所述第二集合包括若干个候选相似物品;
根据所述第一集合中的第一元素与所述第二集合中的第二元素,构建得到若干组有序对,根据所述有序对确定所述物品二元组。
在一些实施例中,所述统计确定所述物品二元组的出现频率,根据所述出现频率,通过对数似然比计算确定所述物品二元组的相似度这一步骤,包括:
根据所述出现频率与行为序列计算得到条件熵以及无条件熵;
计算所述无条件熵与所述条件熵的差值,根据所述差值确定所述物品二元组的相似度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国平安人寿保险股份有限公司,未经中国平安人寿保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210867880.7/2.html,转载请声明来源钻瓜专利网。