[发明专利]基于对比学习的文本推荐方法及相关设备在审
| 申请号: | 202111148783.4 | 申请日: | 2021-09-28 |
| 公开(公告)号: | CN113869420A | 公开(公告)日: | 2021-12-31 |
| 发明(设计)人: | 司世景;王健宗 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F16/9535;G06F17/15;G06F17/16;G06F40/284;G06N3/08;G06N3/04 |
| 代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 熊永强 |
| 地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 对比 学习 文本 推荐 方法 相关 设备 | ||
本申请涉及人工智能技术领域,具体提供了一种基于对比学习的文本推荐方法及相关设备,其中,该方法包括:获取用户的历史浏览文本,对历史浏览文本进行编码,得到历史浏览文本的第一特征向量;基于第一特征向量预测历史浏览文本在预设兴趣类别上的第一概率分布;对历史浏览文本进行数据增广处理,得到增广后的文本数据;对增广后的文本数据进行编码,得到历史浏览文本的第二特征向量;基于第二特征向量预测历史浏览文本在预设兴趣类别上的第二概率分布;根据第一概率分布和第二概率分布确定用户的兴趣模式,以及基于兴趣模式为用户推荐文本。本申请实施例有利于提升文本推荐的准确度。
技术领域
本申请涉及机器学习技术领域,尤其涉及一种基于对比学习的文本推荐方法及相关设备。
背景技术
随着互联网的发展,网络文本信息也呈爆发式增长,人们可以从繁多的文本中获取到各种信息,因此,基于用户的兴趣模式为用户推荐有价值的文本信息变得尤为重要。文本信息推荐通常依赖于机器学习模型去发现用户的兴趣模式,然后为用户进行针对性推送,而机器学习模型需要大量的用户历史浏览记录进行训练,但是由于这类数据的获取难度较大,模型训练缺乏足够的样本,以致于模型难以捕捉到用户的兴趣模式,从而导致文本推荐的准确度较低。
发明内容
针对上述问题,本申请提供了一种基于对比学习的文本推荐方法及相关设备,有利于提升文本推荐的准确度。
为实现上述目的,本申请实施例第一方面提供了一种基于对比学习的文本推荐方法,该方法包括:
获取用户的历史浏览文本,对历史浏览文本进行编码,得到历史浏览文本的第一特征向量;
基于第一特征向量预测历史浏览文本在预设兴趣类别上的第一概率分布;
对历史浏览文本进行数据增广处理,得到增广后的文本数据;
对增广后的文本数据进行编码,得到历史浏览文本的第二特征向量;
基于第二特征向量预测历史浏览文本在预设兴趣类别上的第二概率分布;
根据第一概率分布和第二概率分布确定用户的兴趣模式,以及基于兴趣模式为用户推荐文本。
结合第一方面,在一种可能的实施方式中,增广后的文本数据包括第一增广矩阵和第二增广矩阵,对增广后的文本数据进行编码,得到历史浏览文本的第二特征向量,包括:
对第一增广矩阵进行卷积,得到第一特征图和第二特征图;
对第一特征图进行最大池化,得到第一池化特征图,以及对第二特征图进行最大池化得到第二池化特征图;
将第一池化特征图与第二池化特征图进行拼接,得到第三特征向量;
对第二增广矩阵进行卷积,得到第三特征图和第四特征图;
对第三特征图进行最大池化,得到第三池化特征图,以及对第四特征图进行最大池化得到第四池化特征图;
将第三池化特征图与第四池化特征图进行拼接,得到第四特征向量;
将第三特征向量和第四特征向量确定为第二特征向量。
结合第一方面,在一种可能的实施方式中,基于第二特征向量预测历史浏览文本在预设兴趣类别上的第二概率分布,包括:
采用全连接层对第三特征向量进行分类,得到历史浏览文本在预设兴趣类别上的第三概率分布;
采用全连接层对第四特征向量进行分类,得到历史浏览文本在预设兴趣类别上的第四概率分布;
将第三概率分布和第四概率分布确定为第二概率分布。
结合第一方面,在一种可能的实施方式中,编码是通过神经网络模型执行的,该方法还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111148783.4/2.html,转载请声明来源钻瓜专利网。





