[发明专利]基于阅读时间的用户阅读偏好统计的个性化推送方法在审
申请号: | 201611175971.5 | 申请日: | 2016-12-19 |
公开(公告)号: | CN106777139A | 公开(公告)日: | 2017-05-31 |
发明(设计)人: | 徐俊;项倩红;朱书苗;徐育忠;余永海 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 杭州斯可睿专利事务所有限公司33241 | 代理人: | 王利强 |
地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 阅读 时间 用户 偏好 统计 个性化 推送 方法 | ||
技术领域
本发明属于电子读物技术领域,尤其涉及一种手机端电子读物基于阅读时间的偏好统计方法,并提出个性化推送方案。
背景技术
互联网是人们进行资源共享活动最有效的工具。然而在信息爆炸的今天,困扰人们的不再是有没有自己所想获取的信息,而是如何高校、精确地找到所需要的信息。个性化的信息推荐技术作为信息过滤的手段是解决当前信息过载问题的有效方法。
当前,学术界就用户的行为兴趣来实现个性化已经有所研究。邢玲等人提出了根据用户的浏览内容和浏览时间建立用户的兴趣模型的表示和更新机制,从而根据兴趣模型给用户进行推送;蒲彬等人基于用户的社交信号来对用户实现个性化新闻推荐。专利申请号为:CN104111820A,发明名称为一种为电子读物添加阅读时间的方法和装置的中国发明专利,介绍了如何根据用户的行为来统计用户的实际阅读时间和平均阅读时间。准确地建立用户阅读偏好模型对于提高用户的信息获取效率具有极其重要的意义。
发明内容
为了克服已有推送方式的用户信息获取效率较低的不足,本发明提供了一种有效提高用户信息获取效率的基于阅读时间的用户阅读偏好统计的个性化推送方法。本发明主要根据用户对文章的阅读时间和文本信息来判断用户的偏好程度,从而向用户推荐其所感兴趣的文章。
本发明解决其技术问题所采用的技术方案是:
一种基于阅读时间的用户阅读偏好统计的个性化推送方法,包括以下步骤:
步骤1:建立电子读物平均阅读时间的计算标准;
步骤2:对用户的阅读行为进行判断;
步骤3:用户平均阅读速度的建立;
步骤4:用户单一文章阅读时间的计算;
步骤5:根据用户实际阅读时间和平均阅读时间判断阅读完整度;
步骤6:根据用户阅读完整度建立用户偏好程度;
步骤7:对用户偏好向量和文章内容特征向量进行匹配相似运算,得出用户对未阅读文章的兴趣评价值,可将兴趣评价值较高的一系列文章推荐给用户。
进一步,所述个性化推送方法还包括以下步骤:
步骤8:根据不同用户的阅读偏好建立用户间的相似模型,将相似度较高的用户所阅读的部分文章进行相互推送。
再进一步,所述个性化推送方法还包括以下步骤:
步骤9:将热门新闻、短期的爆炸性新闻推荐给用户。
更进一步,所述步骤1中,电子读物平均阅读时间计算方法包括如下步骤:
1.1)统计电子读物中不同语言分别对应的字数以及其它媒体文件的总播放时长;
1.2)给定不同语言的平均阅读速度;
1.3)依据不同语言的字数和相应的平均阅读速度计算出此语言的阅读时间;
1.4)对各种不同语言的阅读时间和媒体文件的播放时长计算出该文章的总阅读时间。
所述步骤3中,用户平均阅读速度的建立过程如下:首先给定一个初始状态,即先给定一个平均阅读速度保存至其平均速度列表中,该平均速度列表中保存有不同语言的平均速度初始状态值,并记录用户不同语言的实际阅读速度,用实际阅读速度对其初始平均阅读速度进行实时矫正训练,并保存在平均速度列表中作为用户的平均阅读速度。
所述步骤4中,用户单一文章阅读时间的计算:电子读物不同语言对应的字数和用户不同语言的平均阅读速度的比值即为用户不同语言的阅读时间,对不同语言的阅读时间和媒体文件的播放时长求和即为用户单一文章的平均阅读时间;
T=T1+T2+…+TN+Ta+Tb=M1/V1+M2/V2+…+
MN/VN+Ta+Tb(1)
其中,T为用户单一文章的平均阅读时间;T1,T2…TN分别为用户对不同语言的阅读时间;Ta,Tb分别表示媒体文件总的播放时长和图片的阅读时间;M1,M2…MN分别表示不同语言的总字数;V1,V2…VN分别表示用户对不同语言的平均阅读速度;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611175971.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种文件存储的处理方法和终端
- 下一篇:用于非结构化文档搜索的方法及装置