[发明专利]一种基于大数据的科技信息在线推荐方法在审
申请号: | 201811107445.4 | 申请日: | 2018-09-21 |
公开(公告)号: | CN109636495A | 公开(公告)日: | 2019-04-16 |
发明(设计)人: | 骆焦煌 | 申请(专利权)人: | 闽南理工学院 |
主分类号: | G06Q30/06 | 分类号: | G06Q30/06;G06F17/27;G06F16/35 |
代理公司: | 厦门致群专利代理事务所(普通合伙) 35224 | 代理人: | 刘兆庆 |
地址: | 362700 *** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 科技信息 算法模型 用户历史行为数据 用户数据中心 日志采集 大数据 画像 机器学习算法 用户浏览网站 触发事件 访问行为 关系网络 关注信息 深度分析 实时采集 数据基础 图谱分析 行为轨迹 行为数据 学习算法 业务场景 用户关注 用户推荐 用户在线 语义分析 便捷性 算法 标签 分析 采集 优化 制定 | ||
本发明公开了一种基于大数据的科技信息在线推荐方法,包括以下步骤:采集历史科技信息数据;利用JS嵌码收集用户历史行为数据;基于用户历史行为数据,对用户进行打标签,获得用户数据中心;利用深度学习算法、机器学习算法及语义分析算法对用户数据中心进行深度分析,并制定推荐算法模型;利用JS嵌码实时采集用户在线行为数据,根据用户浏览网站过程中的触发事件,利用推荐算法模型为用户推荐相应的科技信息;利用SDK方式对用户的访问行为进行日志采集,并基于日志采集结果对推荐算法模型进行分析优化。本发明采用画像分析和图谱分析获得与用户关注领域相关的关注信息画像结果和关注行为轨迹关系网络,为科技信息精准推荐的业务场景提供了有力的数据基础,确保了线上推荐的便捷性和精准性。
技术领域
本发明涉及大数据处理技术领域,特别涉及一种基于大数据的科技信息在线推荐方法。
背景技术
科技信息是记载科学技术活动、科技知识的信息载体;是记录和传播科技信息的主要手段,也是帮助人们认识客观事物、启发思路、寻求技术支持的重要工具。
目前随着社会科技水平的进步,科技信息数据量呈爆炸性增长。科技信息数据无论是开发还是使用,都离不开网络技术的支撑。但目前网络上的科技信息繁杂,全面性和准确性不高,导致科技人员不容易直接获得真实有价值的信息。如果能够过滤无用信息,实现对科技人员的精准信息推荐,日益受到关注。
目前,科技信息的推荐仍然是简单基于文本近似来进行推荐,而科技人员希望获得的是更为全面、精准的信息,这也导致了目前科技信息推荐的效果不理想。
发明内容
为解决上述问题,本发明提供了一种基于大数据的科技信息在线推荐方法。
本发明采用以下技术方案:
一种基于大数据的科技信息在线推荐方法,包括以下步骤:
S1、采集历史科技信息数据,进行归类后存储到HDFS文件系统;
S2、利用JS嵌码收集用户历史行为数据,并存储到HDFS文件系统,所述历史行为数据包括用户浏览网站时的浏览区域内容、停留时间及Ajax;
S3、基于用户历史行为数据,对用户进行打标签,获得用户数据中心;
S4、利用深度学习算法、机器学习算法及语义分析算法对用户数据中心进行深度分析,并制定推荐算法模型;
S5、利用JS嵌码实时采集用户在线行为数据,根据用户浏览网站过程中的触发事件,利用推荐算法模型为用户推荐相应的科技信息,所述在线行为数据包括用户浏览网站时的点击操作、浏览区域及Ajax;
S6、利用SDK方式对用户的访问行为进行日志采集,并基于日志采集结果对推荐算法模型进行分析优化。
优选地,所述步骤S1包括以下分步骤:
S11、预先建立聚类特征集,所述聚类特征集包括一组命名实体以及与每个命名实体对应的特征信息知识库;
S12、采集历史科技信息数据,对历史科技信息数据进行中文分词并提取关键词,得到关键词数据集;
S13、以关键词作为基础特征,采用k-means算法进行聚类,得到聚类集;
S14、根据聚类集与聚类特征集的主题相关性,对历史科技信息数据进行数据源归类;
S15、根据聚类特征集与关键词数据集的相关性,提取相应的结构化数据集,获得对历史科技信息数据对应的索引文件;
S16、将历史科技信息数据及其对应的索引文件存储到HDFS文件系统。
优选地,所述步骤S2包括以下分步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于闽南理工学院,未经闽南理工学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811107445.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:药品推荐方法及系统
- 下一篇:债权债务管理系统及管理方法