[发明专利]基于多媒体数字影像评论的数据挖掘与处理方法及系统有效
申请号: | 201710071573.7 | 申请日: | 2017-02-09 |
公开(公告)号: | CN106909635B | 公开(公告)日: | 2020-05-19 |
发明(设计)人: | 蔡璟 | 申请(专利权)人: | 深圳市瑞迪兴智能科技有限公司 |
主分类号: | G06F16/435 | 分类号: | G06F16/435;G06F16/48;G06Q50/00 |
代理公司: | 深圳市凯达知识产权事务所 44256 | 代理人: | 刘大弯 |
地址: | 518021 广东省深圳市罗湖区清水河街*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 多媒体 数字影像 评论 数据 挖掘 处理 方法 系统 | ||
1.一种基于多媒体数字影像评论的数据挖掘与处理方法,其特征在于,所述方法包括:
利用网络爬虫技术对社交网络上公开的针对至少一影片的影评数据进行挖掘并将挖掘出的影评数据储存在第一数据库内,在挖掘影评数据的同时对发布影评数据的用户页面数据进行第一预设量的二次挖掘并将挖掘出的用户页面数据储存在第二数据库内;
建立所述影评数据与所述用户页面数据之间的映射关系;
对所述用户页面数据进行兴趣属性分析并依次得出兴趣属性点,将兴趣属性点相符量超出第二预设量的用户页面数据进行分类聚合,形成若干用户页面数据集,并获取分类聚合后的与各用户页面数据集相互映射的影评数据集;
侦测待观影操作事件并挖掘执行待观影操作事件用户公开在社交网络上的数据,对其进行兴趣属性分析并依次得出兴趣属性点,查找与其兴趣属性点相符量超出第二预设量的用户页面数据集,并将与所述用户页面数据集相互映射的影评数据集推送给待观影操作事件用户;
其中,兴趣属性分析并依次得出兴趣属性点,包括:
按照时间顺序依次分析数据,获取数据中易产生兴趣属性点的关键词以及基于该关键词的评价意向,将评价意向为喜爱的关键词列为兴趣属性点;
或者,按照时间顺序依次分析数据,获取基于社交网络的关注人群数据,将关注人群数据按照行业和/或下位代名词进行集群划分,将划分后的处于同一集群内且始终保持对该集群内关注人群关注度的关注人群数据所对应的行业和/或下位代名词列为兴趣属性点;
其中,侦测待观影操作事件并挖掘执行待观影操作事件用户公开在社交网络上的数据,包括:
从社交网络上挖掘与影片相关的非影评数据,分析是否存在未观影和/或想观影关键字,若存在则获取对应的用户页面数据。
2.根据权利要求1所述的一种基于多媒体数字影像评论的数据挖掘与处理方法,其特征在于,侦测待观影操作事件并挖掘执行待观影操作事件用户公开在社交网络上的数据,包括:
从影片购票网站上获取基于影片的检索和/或购票操作事件,获取操作用户基于网站的账号,查找与该账号存在绑定关系的社交网络账号,获取与社交网络账号对应的用户页面数据。
3.一种基于多媒体数字影像评论的数据挖掘与处理系统,其特征在于,所述系统包括:
第一数据挖掘模块,用于利用网络爬虫技术对社交网络上公开的针对至少一影片的影评数据进行挖掘并将挖掘出的影评数据储存在第一数据库内,在挖掘影评数据的同时对发布影评数据的用户页面数据进行第一预设量的二次挖掘并将挖掘出的用户页面数据储存在第二数据库内;
映射建立模块,用于建立所述影评数据与所述用户页面数据之间的映射关系;
兴趣属性分析模块,用于对所述用户页面数据进行兴趣属性分析并依次得出兴趣属性点;
分类聚合模块,用于将兴趣属性点相符量超出第二预设量的用户页面数据进行分类聚合,形成若干用户页面数据集;
数据集获取模块,用于获取分类聚合后的与各用户页面数据集相互映射的影评数据集;
事件侦测模块,用于侦测待观影操作事件;
第二数据挖掘模块,用于挖掘执行待观影操作事件用户公开在社交网络上的数据,对其进行兴趣属性分析并依次得出兴趣属性点;
数据集查找模块,用于查找与其兴趣属性点相符量超出第二预设量的用户页面数据集;
数据集推送模块,用于将与所述用户页面数据集相互映射的影评数据集推送给待观影操作事件用户;
其中,所述兴趣属性分析模块进一步用于按照时间顺序依次分析数据,获取数据中易产生兴趣属性点的关键词以及基于该关键词的评价意向,将评价意向为喜爱的关键词列为兴趣属性点;
或者,用于按照时间顺序依次分析数据,获取基于社交网络的关注人群数据,将关注人群数据按照行业和/或下位代名词进行集群划分,将划分后的处于同一集群内且始终保持对该集群内关注人群关注度的关注人群数据所对应的行业和/或下位代名词列为兴趣属性点;
其中,所述事件侦测模块进一步用于从社交网络上挖掘与影片相关的非影评数据;所述第二数据挖掘模块进一步用于分析是否存在未观影和/或想观影关键字,若存在则获取对应的用户页面数据。
4.根据权利要求3所述的一种基于多媒体数字影像评论的数据挖掘与处理系统,其特征在于,所述事件侦测模块进一步用于从影片购票网站上获取基于影片的检索和/或购票操作事件;所述第二数据挖掘模块进一步用于获取操作用户基于网站的账号,查找与该账号存在绑定关系的社交网络账号,获取与社交网络账号对应的用户页面数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市瑞迪兴智能科技有限公司,未经深圳市瑞迪兴智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710071573.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种后桥连接耳的检测工装
- 下一篇:一种换挡指压装检具