[发明专利]推荐系统及其构建方法有效
| 申请号: | 201610007304.X | 申请日: | 2016-01-06 |
| 公开(公告)号: | CN105677846B | 公开(公告)日: | 2019-12-31 |
| 发明(设计)人: | 杨成;李晨;牛志向 | 申请(专利权)人: | 中国传媒大学 |
| 主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/9536 |
| 代理公司: | 11327 北京鸿元知识产权代理有限公司 | 代理人: | 许向彤;陈英俊 |
| 地址: | 100024 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本申请提供了一种推荐系统及其构建方法。根据一个实施方式的推荐系统包括:算法模块,所述算法模块包括多个二级模块,所述二级模块的参数是可配置的;配置模块,所述配置模块包括多个参数配置模型,分别对所述多个二级模块的参数进行配置;服务模块,为用户或外部设备提供通过所述配置模块对所述算法模块进行配置的接口。通过本发明解决了相关技术中推荐系统的开发复杂度较高的问题,降低了推荐系统的搭建和使用难度。 | ||
| 搜索关键词: | 推荐 系统 及其 构建 方法 | ||
【主权项】:
1.一种推荐系统,包括:/n算法模块,所述算法模块包括多个二级模块,所述二级模块的参数是可配置的;/n所述多个二级模块包括:/n数据抽象模块,该模块支持文件和数据库两种形式的数据源,针对基于内容的推荐,该模块将输入数据转换为向量格式;针对协同过滤推荐,该模块将输入数据源转换为包括用户ID、项目ID和偏好值的关系型表的格式;/n相似度度量模块,基于从数据抽象模块输出的数据计算用户之间的相似度和项目之间的相似度,在基于内容的推荐中,需要计算用户与项目特征向量之间的相似度;在协同过滤推荐中,需要计算用户之间或项目之间的相似度;/n算法处理模块,从存储的多个算法中选择一个或多个算法,基于从数据抽象模块和相似度度量模块输出的数据进行推荐处理;/n算法评估模块,对采用所选择的算法获得的推荐结果进行评估;/n配置模块,所述配置模块包括多个参数配置模型,分别对所述多个二级模块的参数进行配置,包括Web配置模块和XML配置模块,Web配置模块允许网站开发者通过浏览器访问配置页面,在配置页面上填写推荐系统的各项参数,XML配置模块允许网站开发者按照特定的格式规范编写XML配置文件来配置推荐系统的各项参数;/n所述多个参数配置模型包括:/n输入数据源参数配置模型,对输入数据源的数据类型、类别、数据库参数、文件配置参数、特征数据相关参数和用户偏好相关参数中的至少之一进行配置,包括:dataType:定义该参数来表示数据源所包含的数据类型,有两种取值:“content”或“preference”,分别表示输入数据是特征数据或用户偏好数据,当输入的既有特征数据又有用户偏好数据时,指定多个dataType参数来分别表示;sourceType:定义该参数来表示数据源的类别,有两种取值:“mysql”和“file”,分别表示数据源为MySQL数据库或文件,当dataType参数取值为“content”时,sourceType只能取mysql;数据库配置参数:包括dbServerName、dbUser、dbPassword,用于指定数据库的连接配置信息,在sourceType取值为“mysql”时才会用到;文件配置参数:包括filePath,用于指定数据源文件的存储路径,在sourceType取值为“file”时才会用到;特征数据相关参数:包括dbDatabaseName、userTableName、itemTableName、userColumn、itemColumn、occur,依次用于指定用户及项目特征数据所处的数据库名称、表名称、字段名称、以及这些字段之间的逻辑组成关系,其中,userColumn、itemColumn和occur这三个参数多次指定,来表示多个Lucene查询条件,框架通过解析这三个参数的取值来构建复杂查询语句,这些参数在dataType取值为“content”时才会用到;用户偏好数据相关参数:包括dbDatabaseName、preferenceTable、userIDColumn、itemIDColumn、preferenceColumn、timestampColumn,它们依次用于指定用户偏好数据所处的数据库名称、表名称,以及用户ID字段名称、项目ID字段名称、偏好值字段名称和时间戳字段名称,这些参数在dataType取值为“preference”时才会用到;/n相似度度量参数配置模型,对用户之间的相似度度量和项目之间的相似度度量中的至少之一进行配置;/n算法处理参数配置模型,对选用的算法的处理流程、类型、权重、个数、以及用户邻域的类型、用户邻域包含的用户数量和用户邻域的阈值中的至少之一进行配置;/n算法评估参数配置模型,对是否计算协调过滤推荐中预测评分与实际评分的偏差、是否计算协调过滤推荐的查准率、是否计算协调过滤推荐的查全率、和是否计算推荐算法的运行时间中的至少之一进行配置;/n还包括服务模块,为用户或外部设备提供通过所述配置模块对所述算法模块进行配置的接口。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国传媒大学,未经中国传媒大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610007304.X/,转载请声明来源钻瓜专利网。
- 上一篇:一种文件更新的方法、装置和系统
- 下一篇:电子书籍的推送方法和装置





