[发明专利]一种电影用户画像的构建方法在审

专利信息
申请号: 201911373310.7 申请日: 2019-12-27
公开(公告)号: CN111309936A 公开(公告)日: 2020-06-19
发明(设计)人: 胡亚娇;谢志峰;丁友东 申请(专利权)人: 上海大学
主分类号: G06F16/435 分类号: G06F16/435
代理公司: 上海上大专利事务所(普通合伙) 31205 代理人: 陆聪明
地址: 200444*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 电影 用户 画像 构建 方法
【权利要求书】:

1.一种电影用户画像的构建方法,其特征在于,包括如下步骤:

步骤一,在电影社区网站选取曾发布过中文电影评论的用户,对用户的静态数据和动态数据进行采集;

步骤二,根据获取到的样本电影用户的多维数据,构建电影用户画像的三层标签体系;

步骤三,根据电影用户多维数据与标签体系中标签的对应关系,按照标签层级由下往上的方式对电影用户的一层标签、二层标签的每一个标签进行预测,构建一个较为完善的单一电影用户的用户画像模型;

步骤四,根据用户特征,对具有某一类共同特征的群体电影用户进行电影偏好分析,生成电影用户画像的第三层标签,构建群体用户画像。

2.根据权利要求1所述的电影用户画像的构建方法,其特征在于,所述步骤一中,从剧情、喜剧、动作、爱情、科幻、动画、悬疑、惊悚、恐怖、犯罪、同性、音乐、歌舞、传记、历史、战争、西部、奇幻、冒险、灾难、武侠二十一种电影类型中,每种选取等量的热门电影下的影评中的用户进行数据采集,组成样本用户,既能保证电影类型的多样性,又能保证电影用户的活跃性和特征多样性。

3.根据权利要求1所述的电影用户画像的构建方法,其特征在于,所述步骤一中的用户的静态数据和动态数据包括用户基本信息、用户影评信息、电影信息、用户标签信息四种,在数据库中建立四张表分别存储四类信息。

4.根据权利要求1所述的电影用户画像的构建方法,其特征在于,所述步骤二中的多维数据,包括电影用户的基本数据,影评数据,日记数据以及观影数据,根据电影用户每一维度的数据相应地构建不同的标签。

5.根据权利要求1所述的电影用户画像的构建方法,其特征在于,所述步骤三中的模型,根据标签与数据的对应关系,电影用户画像的构建包括电影用户个人画像和电影用户群体画像,电影用户个人画像的标签使用机器学习分类模型和自然语言处理,电影用户群体画像的标签使用统计学分析。

6.根据权利要求1所述的电影用户画像的构建方法,其特征在于,所述步骤三中对电影用户的每一个标签进行预测,分别使用统计学、机器学习随机森林、XGBoost分类算法、AdaBoost.MLR多标签分类算法、自然语言处理的句法分析中的一种方法。

7.根据权利要求3所述的电影用户画像的构建方法,其特征在于,根据电影用户静态数据和动态数据,将电影用户数据归类到基本属性,社交属性,观影偏好以及个性特征四个领域中,将每个领域的数据分别对应到电影用户四个领域的标签,其中每个领域各含两种以上的电影用户标签,其中每一种标签对应至少两种标签值,所有标签的集合为电影用户画像的标签库。

8.根据权利要求7所述的电影用户画像的构建方法,其特征在于,所述社交属性中的用户社交能力标签是电影用户双向社交程度的度量,用户社交能力标签的相关数据由用户单向社交数据电影用户关注的其他电影用户数量和被其他用户关注数量构成,其中关注数和被关注数分别分为强、中、弱三个等级;根据所有用户被关注数和关注数的最大值和最小值,分别对被关注数和关注数强、中、弱三个等级设立两个阈值,对用户单向社交进行分类;用户社交能力类别依据关注数和被关注数分为九个等级。

9.根据权利要求7所述的电影用户画像的构建方法,其特征在于,所述观影偏好特征之一为用户观看电影所属类型标签,电影标签分类依据“拍摄于(年份),在(地区/国家),(环境背景)和(历史背景)下,以(形式)和(方式)和(风格)讲述了(角色)在(年代)的(内容)”的方法使用十大类电影特征;对用户观看历史中的电影进行归类,其中每部电影在每种类型域内最多匹配一个值;为每个电影用户匹配观影类型,贴观影标签。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海大学,未经上海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911373310.7/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top