[发明专利]一种新闻召回方法和系统有效
申请号: | 201910132210.9 | 申请日: | 2019-02-22 |
公开(公告)号: | CN109871487B | 公开(公告)日: | 2021-03-23 |
发明(设计)人: | 安鸣佳 | 申请(专利权)人: | 北京搜狐新媒体信息技术有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/335 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
地址: | 100190 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 新闻 召回 方法 系统 | ||
1.一种新闻召回方法,其特征在于,包括:
获取用户点击新闻id序列作为用户特征,以及获取下一时刻用户点击的新闻id和未点击的新闻id作为标签,下一时刻为所述用户点击新闻id序列中对应点击新闻id的最新时刻确定;
基于预先设置的预测模型对所述用户特征和所述标签进行训练,并对所述用户特征进行转换,生成对应所述用户特征的多维向量;
根据所述多维向量和所述下一时刻用户点击新闻id、未点击的新闻id进行余弦相似度计算,得到对应所述多维向量的余弦相似度;
基于所述多维向量对应的余弦相似度的大小,由大至小选取N个多维向量,确定所述N个多维向量对应的新闻id,其中,N的取值为大于等于2的正整数;
其中,所述预先设置的预测模型的设置过程,包括:
构建原始神经网络模型;
获取预设数目的训练用户分别对应的用户点击的新闻id和未点击的新闻id;
将各个所述训练用户对应的用户点击的新闻id和未点击的新闻id依次输入至所述原始神经网络模型,得到各个所述训练用户对应的初始训练结果;
依据所述初始训练结果更新所述原始神经网络模型的参数得到预测模型。
2.根据权利要求1所述的方法,其特征在于,所述基于预先设置的预测模型对所述用户特征和所述标签进行训练,并对所述用户特征进行转换,生成对应所述用户特征的多维向量,包括:
在预先设置的预测模型的嵌入层中,基于lstm长短期记忆模型将所述用户特征转换成多维向量;
在预先设置的预测模型的输出层中,基于mlp多层感知机将所述多维向量进行投影,生成所述用户特征对应的多维向量。
3.根据权利要求1所述的方法,其特征在于,所述根据所述多维向量和所述下一时刻用户点击的新闻id、未点击的新闻id进行余弦相似度计算,得到对应所述多维向量的余弦相似度,包括:
所述多维向量与所述下一时刻用户点击的新闻id进行余弦相似度计算,得到所述多维向量各自对应的第一余弦相似度;
所述多维向量与所述下一时刻未点击的新闻id进行余弦相似度计算,得到所述多维向量各自对应的第二余弦相似度。
4.根据权利要求1所述的方法,其特征在于,所述基于所述多维向量对应的余弦相似度的大小,由大至小选取N个多维向量,确定所述N个多维向量对应的新闻id,包括:
基于所述多维向量的余弦相似度的大小进行排序,选取由大到小的N个多维向量,确定所述N个多维向量对应的新闻id;
或
对所述多维向量对应的余弦相似度的大小进行判断,当所述多维向量对应的余弦相似度值大于预设阈值时,确定大于预设阈值的N个多维向量,由大至小选取N个多维向量,确定所述N个多维向量对应的新闻id。
5.一种新闻召回系统,其特征在于,包括:
获取单元,用于获取用户点击新闻id序列作为用户特征,以及获取下一时刻用户点击的新闻id和未点击的新闻id作为标签,下一时刻为所述用户点击新闻id序列中对应点击新闻id的最新时刻确定;
训练转换单元,用于基于预先设置的预测模型对所述用户特征和所述标签进行训练,并对所述用户特征进行转换,生成对应所述用户特征的多维向量;
计算单元,用于根据所述多维向量和所述下一时刻用户点击的新闻id、未点击的新闻id进行余弦相似度计算,得到对应所述多维向量的余弦相似度;
确定单元,用于基于所述多维向量对应的余弦相似度的大小,由大至小选取N个多维向量,确定所述N个多维向量对应的新闻id,其中,N的取值为大于等于2的正整数;
其中,所述训练转换单元包括:
构建模块,用于构建原始神经网络模型;
获取模块,用于获取预设数目的训练用户分别对应的用户点击的新闻序列id和未点击的新闻序列id;
输入模块,用于将各个所述训练用户对应的用户点击的新闻序列id和未点击的新闻序列id依次输入至所述原始神经网络模型,得到各个所述训练用户对应的初始训练结果;
更新模块,用于依据所述初始训练结果更新所述原始神经网络模型的参数得到预测模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狐新媒体信息技术有限公司,未经北京搜狐新媒体信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910132210.9/1.html,转载请声明来源钻瓜专利网。