[发明专利]一种多媒体信息处理方法、装置及存储介质有效
申请号: | 201811627152.9 | 申请日: | 2018-12-28 |
公开(公告)号: | CN109710778B | 公开(公告)日: | 2021-06-04 |
发明(设计)人: | 曾启文;刘昕;况铁梅;冯林;姚琪 | 申请(专利权)人: | 咪咕文化科技有限公司;中国移动通信集团有限公司 |
主分类号: | G06F16/435 | 分类号: | G06F16/435;G06N20/00 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 王姗姗;张颖玲 |
地址: | 100032 北京市西城区德*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 多媒体 信息处理 方法 装置 存储 介质 | ||
本发明公开了一种多媒体信息处理方法,所述方法包括:获取第一类多媒体文件的数据;对所述数据进行用于适配机器学习模型的预处理;在所述机器学习模型中,根据经过预处理的数据确定用户对所述第一类多媒体文件的兴趣度。本发明还公开了一种多媒体信息处理装置及存储介质。
技术领域
本发明涉及通信领域,尤其涉及一种多媒体信息处理方法、装置及存储介质。
背景技术
相关技术中,通常基于决策树模型、最佳组合模型、神经网络模型等建模方法,采用社交网络链路预测技术、社交网络中的用户属性预测技术、社交网络的突发热点事件技术、社交网络流行度预测技术、商品-用户点击率预测技术、商品-购买量预测技术等基于数据的用户行为预测技术来预测用户对多媒体文件内容的兴趣度。
但是,相关技术中预测用户对多媒体文件内容的兴趣度时,不能够兼顾微观个体间的影响和宏观趋势的影响;并且,未考虑预测用户对多媒体文件内容的兴趣度时所采用的数据,对未来用户对多媒体文件内容的兴趣度的权重。基于上述因素,相关技术不能够全面的预测用户对多媒体文件内容的兴趣度。
发明内容
有鉴于此,本发明实施例期望提供一种多媒体信息处理方法、装置及存储介质,能够
为达到上述目的,本发明实施例的技术方案是这样实现的:
第一方面,本发明实施例提供一种多媒体信息处理方法,所述方法包括:
获取第一类多媒体文件的数据;
对所述数据进行用于适配机器学习模型的预处理;
在所述机器学习模型中,根据经过预处理的数据确定用户对所述第一类多媒体文件的兴趣度。
上述方案中,所述获取第一类多媒体文件的数据,包括:
获取第一时间间隔内,至少两个用户对所述第一类多媒体文件的数据。
上述方案中,所述数据包括下述中的至少一项:
所述第一类多媒体文件的使用数据;
所述第一类多媒体文件中的至少两个多媒体文件的属性数据。
上述方案中,所述对所述数据进行用于适配机器学习模型的预处理,包括:
将所述第一时间间隔内的使用数据划分为至少四个第一数据集,且每两个第一数据集之间的时间间隔为固定值;
按照第一压缩比对所述第一数据集进行第一合并处理,得到至少两个第二数据集;
按照第二压缩比对所述第二数据集进行第二合并处理,得到至少一个第三数据集。
上述方案中,所述对所述数据进行用于适配机器学习模型的预处理,包括:
基于多媒体文件标识ID,将所述第三数据集划分为至少两个第四数据集;
基于用户所述第一类多媒体文件不同维度的操作,将所述第四数据集划分为相应维度的第四数据子集;
对所述第四数据子集进行处理,获取所述第四数据子集对应的属性。
上述方案中,所述对所述数据进行用于适配机器学习模型的预处理,包括:
对所述第四数据子集进行反向合并处理,获得在表征用户在第一时间点对所述第一类多媒体文件的行为属性的第五数据集以及表征用户在第二时间段对所述第一类多媒体文件的行为属性的第六数据集。
上述方案中,所述根据经过预处理的数据确定用户对所述第一类多媒体文件的兴趣度,包括:
基于所述第五数据集确定所述机器学习模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于咪咕文化科技有限公司;中国移动通信集团有限公司,未经咪咕文化科技有限公司;中国移动通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811627152.9/2.html,转载请声明来源钻瓜专利网。