[发明专利]一种电影用户画像的构建方法在审
| 申请号: | 201911373310.7 | 申请日: | 2019-12-27 |
| 公开(公告)号: | CN111309936A | 公开(公告)日: | 2020-06-19 |
| 发明(设计)人: | 胡亚娇;谢志峰;丁友东 | 申请(专利权)人: | 上海大学 |
| 主分类号: | G06F16/435 | 分类号: | G06F16/435 |
| 代理公司: | 上海上大专利事务所(普通合伙) 31205 | 代理人: | 陆聪明 |
| 地址: | 200444*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 电影 用户 画像 构建 方法 | ||
本发明涉及一种电影用户画像的构建方法,包括如下步骤:步骤一,在电影社区网站选取曾发布过中文电影评论的用户,对用户的静态数据和动态数据进行采集;步骤二,根据获取到的样本电影用户的多维数据,构建电影用户画像的三层标签体系;步骤三,根据电影用户多维数据与标签体系中标签的对应关系,按照标签层级由下往上的方式对电影用户的一、二层标签进行预测,构建一个较为完善的单用户画像模型;步骤四,对具有某一类共同特征的群体电影用户进行电影偏好分析,生成电影用户画像的第三层标签,构建群体用户画像。本发明对用户原始数据做出分析映射生成标签体系,实现了电影用户属性标签化,和同一属性人群的群体用户画像模型的构建。
技术领域
本发明涉及一种电影用户画像的构建方法,属于大数据、数据挖掘、自然语言处理、机器学习领域。
背景技术
在大数据和社交媒体的背景下,互联网平台分析用户信息和行为中潜在的用户偏好,并将平台信息进行个性化推广。用户画像,即用户信息标签化,是基于一系列真实数据的目标用户模型。用户画像可以用“贴标签”的方式标注用户的社会属性、生活习惯和消费行为等。用户画像作为推荐系统的一个主要部分,通过挖掘用户个性特征、用户之间的个体差异、平台用户群体特征,广泛地被使用在电商商品推荐、广告商广告投放等商业领域。在用户画像勾勒的作用下,平台得以对用户进行个性化推荐,用户得到更好的体验,平台也可以吸引更多的流量。
现阶段关于用户画像的研究和实现大多是基于志愿者的人格量表调查的,首先对用户进行量表形式的调查,计算得分得到用户所属的人格类型,然后用社交数据中的词汇进行训练,得出表示社交词汇与人格类型的相关性的模型,最后根据用户社交数据预测人格类型。这种方式基于一部分用户调查,耗费大量的人力物力,而且研究的内容很有局限性,量表的制作有一定难度,准确性未可知。
Dittman等在“Random forest:A reliable tool for patient responseprediction”,IEEE International Conference on BioinformaticsBiomedicineWorkshops.IEEE,2011.中将随机森林应用于预测患者对药物的反应,实验中对高维数据使用随机森林和另外5个分类学习器进行预测,结果证明随机森林在任意的特征选取策略的分类预测都有最好的效果。
王莉莉等在“基于标签相关性的多标签分类AdaBoost算法”,四川大学学报(工程科学版), 2016,48(5):91-97.提出适用于多标签分类的AdaBoost算法AdaBoost.MLR,该算法合理的利用待遇测标签之间的相关性,提高了多标签分类的准确性。
刘啸剑等在“Graph Based Keyphrase Extraction Using LDA Topic Model”,Journal of the China Society for Scientific and Technical Information,2016,35(6):664-672.提出一种结合LDA 与TextRank的关键词抽取模型,并在中短型文本数据集Huth2003和长文档数据集DUC2001 上进行实验,结果表明了该方法的有效性。
Fang Long等在“Structure-Function Recognition of Academic Text——Application in Automatic Keywords Extraction”,Journal of the China Societyfor Scientific and Technical Information,2017,36(6):599-605.一文中,提出基于学术文本的结构功能识别方法,提出融合学术文本结构功能特征的多特征组合提取方法,并利用学术文本的章节标题对其结构功能进行识别,分别通过SVM二分类和LambdaMART学习排序算法在计算机语言学领域的文献集上进行关键词抽取,实验结果表明,相比基准特征,多特征组合在关键词提取的效果上取得了较大的提升。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海大学,未经上海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911373310.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于复卷机的卸料装置
- 下一篇:一种手持雕刻设备





