[发明专利]一种信息处理方法、装置、设备及存储介质有效
| 申请号: | 202010656465.8 | 申请日: | 2020-07-09 |
| 公开(公告)号: | CN111881666B | 公开(公告)日: | 2021-08-17 |
| 发明(设计)人: | 吴德龙 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
| 主分类号: | G06F40/216 | 分类号: | G06F40/216;G06F16/9535;G06K9/62;G06N20/00 |
| 代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 熊永强;贾允 |
| 地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 信息处理 方法 装置 设备 存储 介质 | ||
1.一种信息处理方法,其特征在于,所述方法包括:
将用户历史操作信息按照操作时间进行排序,得到信息操作序列;
基于所述信息操作序列中每个信息各自对应的信息标签,对所述信息操作序列进行转换,得到信息标签序列;
对所述信息标签序列进行向量分析,得到所述信息标签序列中每个信息标签各自对应的标签向量;
对每个信息各自对应的信息标签的标签向量进行加权处理,得到每个信息各自对应的候选信息向量;
基于每个信息各自对应的候选信息向量,确定所述信息标签序列对应的主成分向量;
将每个信息各自对应的候选信息向量与所述主成分向量的差值,作为每个信息各自对应的目标信息向量。
2.根据权利要求1所述的方法,其特征在于,
在所述基于所述信息操作序列中每个信息各自对应的信息标签,对所述信息操作序列进行转换,得到信息标签序列之前,所述方法还包括:
获取每个信息各自对应的信息标签;
相应地,所述基于所述信息操作序列中每个信息各自对应的信息标签,对所述信息操作序列进行转换,得到信息标签序列,包括:
使用每个信息各自对应的信息标签,替换所述信息操作序列中相应的信息;
将替换后的信息操作序列作为所述信息标签序列。
3.根据权利要求2所述的方法,其特征在于,
所述获取每个信息各自对应的信息标签,包括:
基于标签获取模型对所述信息操作序列中每个信息进行标签分析,得到每个信息各自对应的信息标签,所述标签获取模型基于样本信息及其对应的信息标签标注结果进行学习训练得到;
相应地,所述对所述信息标签序列进行向量分析,得到所述信息标签序列中每个信息标签各自对应的标签向量,包括:
基于词向量模型对所述信息标签序列进行向量分析,得到所述信息标签序列中每个信息标签各自对应的标签向量。
4.根据权利要求1所述的方法,其特征在于,所述对每个信息各自对应的信息标签的标签向量进行加权处理,得到每个信息各自对应的候选信息向量,包括:
计算每个信息各自对应的信息标签的标签向量的平均值,得到每个信息各自对应的候选信息向量;或,
计算每个信息各自对应的信息标签的逆文档频率;
基于每个信息各自对应的信息标签的逆文档频率和标签向量,确定每个信息各自对应的候选信息向量;或,
基于预设参数、每个信息各自对应的信息标签在相应的信息中出现的概率以及每个信息各自对应的信息标签的标签向量,确定每个信息各自对应的候选信息向量。
5.根据权利要求1所述的方法,其特征在于,所述基于每个信息各自对应的候选信息向量,确定所述信息标签序列对应的主成分向量,包括:
从所述信息操作序列中抽取预设数量个信息,所述预设数量小于所述信息操作序列中所包含的信息的数量;
基于奇异值分解方法对所述预设数量个信息对应的候选信息向量进行主成分分析,得到所述预设数量个信息对应的主成分向量。
6.根据权利要求1所述的方法,其特征在于,在所述将每个信息各自对应的候选信息向量与所述主成分向量的差值,作为每个信息各自对应的目标信息向量之后,所述方法还包括:
通过近似搜索方法召回与每个信息各自对应的目标信息向量相关的关联向量,所述关联向量与相应的目标信息向量之间的相似度大于预设相似阈值;
向用户推荐所述关联向量对应的信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010656465.8/1.html,转载请声明来源钻瓜专利网。





