[发明专利]一种电子书内容推荐系统在审
| 申请号: | 202111277878.6 | 申请日: | 2021-10-30 |
| 公开(公告)号: | CN114218473A | 公开(公告)日: | 2022-03-22 |
| 发明(设计)人: | 高桂松 | 申请(专利权)人: | 苏州晴勒信息科技有限公司 |
| 主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06Q30/06 |
| 代理公司: | 北京盛凡佳华专利代理事务所(普通合伙) 11947 | 代理人: | 胡欢 |
| 地址: | 215123 江苏省苏州市苏州*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 电子书 内容 推荐 系统 | ||
本发明涉及电子书阅读软件技术领域,特别涉及一种电子书内容推荐系统。一种电子书内容推荐系统,包括:日志解析模块、文本表示模型构建模块、数据预处理模块、所述近似筛选模块、评分预测模块和结果输出模块。本发明的技术方案利用网络电子书网站中用户群体产生的海量数据以及电子书文本信息等,采用有效的推荐系统,为每本电子书提供相似电子书集合以及为每个用户提供个性化的电子书推荐列表。
技术领域
本发明涉及电子书阅读软件技术领域,特别涉及一种电子书内容推荐系统。
背景技术
在此互联网时代,电子书也顺时而生,以低成本、携带方便、可携带量大等特点进入人们的日常生活,在很多方面替代了传统书籍。而电子书中的网络电子书作为人们工作闲暇之余的一种消遣工具,近年来一直处于高速发展的状态。目前网络电子书种类繁多,电子书总量也非常庞大,对于一个电子书网站而言,电子书书本数量一般从几千到几万甚至更多,而用户一般难以从大量的电子书中挑选到自己喜欢的电子书。为解决此类信息过载问题,传统的方法是将电子书进行分类、分榜单,然后用户根据类别或者榜单自己去寻找该类下的电子书。但这类方法存在两个问题,第一是尽管已经对电子书进行分类,但是每个类别下的电子书数量依旧非常多,用户仍然难以发现自己喜欢的电子书;第二是不同的用户兴趣爱好显然是不同的,因此喜欢的电子书也不可能都是一样的,然而上述方法中对于每个用户展示的电子书列表都是一样的,不具备个性化的功能。因此对于一个电子书网站而言,快速有效的为每个用户提供个性化的推荐列表是提高用户粘性的一个关键点。然而目前在网络电子书推荐领域相关研究很少,而且随着数据量的不断增大以及用户标准的不断提高,传统的推荐方法存在指标低、运算效率不高等问题,因此改善推荐算法,提升算法指标和运行效率具有非常重要的意义。
发明内容
本发明提供一种网络电子书内容推荐系统,为实现上述目的,本发明采用以下技术方案:一种电子书内容推荐系统,包括:日志解析模块、文本表示模型构建模块、数据预处理模块、所述近似筛选模块、评分预测模块和结果输出模块。
日志解析模块:用户行为数据来自用户每次访问电子书网站时发出的请求日志,每一条请求日志表明用户的每次点击操作,日志内容主要记录了访问用户的ip地址、发出请求的时间,请求的url地址,原地址,用户所用的设备信息等。而url地址中包含了访问链接、用户ID、书本ID、模块访问入口、具体章节等信息。日志处理模块采用正则表达式匹配的方式,从每条日志记录中提取出用户ID、书本ID、模块访问入口、访问的章节以及时间信息,其中模块访问入口是指用户在网站发出请求时所在的模块,由此得到记录【用户ID,书本ID,模块访问入口,访问的章节,访问时间】。该模块采集用户的搜索行为和点击行为,以获取用户兴趣偏好特征并储存;
文本表示模型构建模块:将电子书简介、正文等非结构化数据转化为可计算的文本表示模型,首先采用分词工具将电子书文本进行分词,同时过滤掉内容相关性差的词语,得到每本电子书对应的关键词集合。再使用LDA算法进行训练,将电子书用主题分布来进行描述,并将结果存于文件中,作为近似筛选模块的输入。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州晴勒信息科技有限公司,未经苏州晴勒信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111277878.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种干菜发泡系统
- 下一篇:一种兼顾生产柔性与生产效率的型材冲孔切断机
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法





