[发明专利]一种基于人口属性关键字向量的协作过滤推荐方法有效
申请号: | 200910045655.X | 申请日: | 2009-01-21 |
公开(公告)号: | CN101489107A | 公开(公告)日: | 2009-07-22 |
发明(设计)人: | 贺樑;顾君忠;邓双义;夏薇薇;陈天;任磊;何克勤;杨燕;林欣;马天龙 | 申请(专利权)人: | 华东师范大学 |
主分类号: | H04N7/173 | 分类号: | H04N7/173;H04N5/44 |
代理公司: | 上海蓝迪专利事务所 | 代理人: | 徐筱梅 |
地址: | 200062上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 人口 属性 关键字 向量 协作 过滤 推荐 方法 | ||
1.一种引入基于人口属性关键字向量的协作过滤推荐方法,其特征在于IPTV节目的界面上,提供用户评分的可视化菜单,并根据终端机顶盒传来的用户观看时间、行为操作、节目评分数据作出节目推荐列表给目标用户,其具体步骤如下:
a)、收集用户人口属性信息和自我描述信息;
b)、收集用户对项目的评分数据形成“用户-项目”评分矩阵A(m,n);评分矩阵A(m,n),以用户评分信息和用户行为数据进行矩阵排列,m为行代表用户,n为列代表项目,矩阵中的元素值则代表该行用户对该列项目的喜爱程度;
c)、使用中文分词和关键字匹配技术寻找每个用户所拥有的关键字集合;
d)、计算目标用户和其他用户之间的关键字集合之间的交集;
e)、计算目标用户和其他用户之间的共同评分项目;
f)、根据步骤d)得到的用户之间关键字集合的交集,利用词频权重公式计算交集中各个关键字的权重,其中fx表示关键字wx在所有用户属性关键字集合中出现的次数,maxz表示在所有用户属性关键字集合中出现最多的关键字所出现的次数;该集合中所有的关键字权重之和基于为人口属性的相似度SimNewij;根据步骤e)的结果,用协同过滤计算方法计算基于“用户-评分”矩阵的相似度SimColij;将SimNewij与SimColij进行融合,得目标用户和其他用户之间的相似度;其融合公式如下:
式中:N为系统设定值,表示在用户评分项目数量达到多少以前均考虑使用用户人口统计信息;
g)、选取相似度最大的K个用户作为其最近邻居集;
h)、根据最近邻居集对目标用户未评分项目采用预测评分公式计算得到预测评分值并对其值排序;
i)、将预测评分最大的前N个项目作出推荐列表给目标用户。
2.根据权利要求1所述的协作过滤推荐方法,其特征在于所述使用中文分词和关键字匹配技术寻找每个用户所拥有的关键字集合是在用户每次注册以及更新个人信息时使用。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东师范大学,未经华东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910045655.X/1.html,转载请声明来源钻瓜专利网。