[发明专利]一种资讯标签兴趣度的预估方法有效

专利信息
申请号: 201810505164.8 申请日: 2018-05-24
公开(公告)号: CN108804577B 公开(公告)日: 2022-11-01
发明(设计)人: 常剑;孙宇;张洪刚;徐彬;高珊 申请(专利权)人: 联通在线信息科技有限公司;北京邮电大学
主分类号: G06F16/9535 分类号: G06F16/9535;G06K9/62
代理公司: 北京挺立专利事务所(普通合伙) 11265 代理人: 叶树明
地址: 100176 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 资讯 标签 兴趣 预估 方法
【说明书】:

发明公开一种资讯标签兴趣度的预估方法,包括:创建并维护含标签的候选资讯库;根据用户人口学信息得到用户属性资讯标签兴趣度向量;获取预设时间段内多个用户的历史行为数据并进行预处理,得到已训练的深度学习模型;获取当前用户的历史行为数据并进行预处理,得到当前用户的用户行为资讯标签兴趣度向量;根据当前用户的用户属性资讯标签兴趣度向量和用户行为资讯标签兴趣度向量计算得到用户‑资讯标签兴趣度向量,最终确定用户最感兴趣的若干个资讯标签。本发明解决用户兴趣度预估的冷启动问题,避免了直接从互联网中选取资讯时常会出现的资讯质量低的问题,同时降低了对用户兴趣度预估问题的计算量,适用于每个样本含有多个标签的场景。

技术领域

本发明涉及的是一种资讯标签兴趣度的预估方法,属于计算技术领域。

背景技术

随着互联网的快速发展,网络上资讯数量庞大且呈爆炸式增长,而资讯的质量却良莠不齐,若直接对获取的所有资讯进行用户兴趣度预估操作,很可能会将内容质量较差的资讯推送给用户,影响用户体验,且对所有资讯进行用户兴趣度预估操作会导致算法计算量增大,对计算资源造成浪费。

虽然用户浏览的资讯不同,但资讯对应的资讯标签往往可划分为几大类别,且用户对某资讯标签的感兴趣持续时间要远超过对某一个资讯的感兴趣持续时间。例如用户浏览了某个资讯标签为“财经”的资讯后基本不会重新阅读同一个资讯,但用户仍然对“财经”标签的其他资讯感兴趣。因此通过对用户对资讯标签的兴趣度预估方法找到用户感兴趣的资讯标签,对资讯个性化推送等研究和应用具有重要意义。

当前实际应用中所使用的用户兴趣度预估方法中普遍存在的问题是冷启动问题,即用户未浏览过资讯时如何对用户进行兴趣度预估。

现有技术中,有通过基于递归神经网络的方法进行预估,该方法通过将用户浏览的资讯对应的资讯标签依次输入递归神经网络中来进行训练和预测用户感兴趣的资讯标签。该方法可以利用用户历史行为中的时序特征,因此在训练样本充足和递归神经网络参数调节合适的情况下,效果较好。但是该方法存在以下缺陷:

1在用户未浏览过任何资讯时无法进行用户兴趣度预估。

2无法利用用户的人口学信息,如性别、年龄、地域等。

现有技术中,有通过基于TF-IDF(词频-逆文本频率指数)的方法得到每个资讯的关键词,通过对当前用户浏览的资讯中的关键词进行统计分析得到用户对各个关键词的兴趣度。

TF-IDF方法是一种统计方法,对于一个资讯来说,某字词出现在该资讯中的频率体现了该字词的重要程度,某字词在该资讯中出现的次数越多,该字词在该资讯中的重要性越大,但该字词的重要性会随着该字词在全部资讯中出现的频率的升高而下降。即如果某字词在当前资讯中出现的频率高,并且在其他资讯中很少出现,则认为该字词可以很好地代表该资讯,此时该字词即为当前资讯的关键词。通过对用户浏览的资讯中的关键词进行统计分析,可得到用户对各个关键词的兴趣度,可用于后续基于资讯关键词的资讯个性化推送,但是该方法存在以下缺陷:

1对每个资讯中的每个字词统计该字词在当前资讯中出现的次数、在所有资讯中出现的次数,计算量较大。

2统计得到的关键词分布太广泛,且每个关键词代表的内容可能针对于很小的领域,不利于控制预估的用户感兴趣的资讯范围。例如使用TF-IDF得到用户浏览的某资讯对应的关键词为“林黛玉”,若根据该关键词对用户进行用户兴趣度预估,则后续给用户的资讯推送中很可能会过于集中于包含“林黛玉”的资讯,而难以很好地扩展到“红楼梦”或“中国文学”等,影响兴趣度预估和资讯推送效果。

3即使某资讯包含的关键词在用户兴趣度预估时得分很高,也可能因为资讯质量问题而不能引起用户兴趣。

4在用户未浏览过任何资讯时无法进行用户兴趣度预估。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于联通在线信息科技有限公司;北京邮电大学,未经联通在线信息科技有限公司;北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810505164.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top