[发明专利]一种基于OCEAN模型的个性化推荐的方法有效
申请号: | 201711131237.3 | 申请日: | 2017-11-15 |
公开(公告)号: | CN107895303B | 公开(公告)日: | 2022-03-25 |
发明(设计)人: | 刘珊;杨波;郑文锋;刘雨薇 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06Q30/06 | 分类号: | G06Q30/06;G06F16/9535 |
代理公司: | 成都行之专利代理事务所(普通合伙) 51220 | 代理人: | 温利平 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 ocean 模型 个性化 推荐 方法 | ||
1.一种基于OCEAN模型的个性化推荐的方法,其特征在于,包括以下步骤:
(1)、建立社交网站用户的OCEAN模型
(1.1)、选取若干微博账户,对这些用户进行五种人格测试,得到五种人格维度的得分,再将这五种人格维度的得分作为被试用户的OCEAN模型;
(1.2)、通过模拟浏览器的方式获取页面内容,抓取被试用户的微博数据,用户的微博数据分为两个部分:文本文档和用户基本信息;其中,文本文档指用户发的所有微博文本的汇总,用户基本信息包含用户注册时间、用户关注数量、用户微博条数、是否有个性签名,然后分别将每位用户的微博数据汇总成一篇文本文档;
(1.3)、对文本文档进行预处理:文本文档进行过滤、分词处理,以及去停止词后存放在指定的数据库中;
(1.4)、将数据库中所有被试用户的文本文档导入到LDA主题模型中,LDA主题模型输出每位被试用户的文本文档主题概率分布;
其中,LDA主题模型的输入包括:所有用户文本文档的集合、主题数K、超参数α和β;
(1.5)、以被试用户的文档主题概率分布作为样本输入,以被试用户的OCEAN模型作为样本输出,利用BP神经网络进行训练,建立用户文档主题分布与用户OCEAN模型之间的映射模型,并该映射模型作为预测社交网站用户的OCEAN模型;
(2)、基于社交网站用户的OCEAN模型对用户进行个性化推荐
(2.1)、用户聚类
基于社交网站用户的OCEAN模型,利用K均值聚类算法将用户分成K种不同性格的用户群;
设k是k-means算法的输入参数,代表该算法在数据集上分割并计算后输出的数量,数据集由n个数据点组成,表示所有用户的数量,输入参数为聚类的数目k和用户的OCEAN模型数据;具体算法如下:
1)、将用户OCEAN模型的五个维度的数据几位集合I={i1,i2,...,i5};
2)、检索所有的m个用户,记为集合U={u1,u2,...,um};
3)、从m个用户中,人工选取其中访问量较高其标签不同的用户作为初始的聚类中心,记为{W1,W2,...,WK};
4)、循环输入向量,计算每个簇中对象的平均值,更新聚类中心,直到不再发生变化;
(2.2)、根据目标用户所属类别对其进行个性化推荐
在目标用户出现时,首先确定目标用户所在的聚类类别,然后将目标用户所在类别中的每个用户发的所有微博分别作为一个候选集item,再利用词频-逆文档分别对每个候选集item中进行文本特征随机抽取,构建出一个n维向量,作为每个候选集item的属性资料,其中,每抽取一条微博作为一维向量;
根据目标用户的微博数据汇总成一篇文本文档,同样利用词频-逆文档频率,对目标用户的文本文档进行文本特征随机抽取,构建出一个m维向量,作为目标用户的喜好资料;
根据余弦相似性公式,计算用户的喜好资料与每一个候选集item的属性资料的相似度,将相似度最高的候选集item作为推荐集,推荐给目标用户。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711131237.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于共享系统推荐用户信息的方法
- 下一篇:一种购物商城管理系统