[发明专利]一种多媒体信息处理方法、装置及存储介质有效
申请号: | 201811627152.9 | 申请日: | 2018-12-28 |
公开(公告)号: | CN109710778B | 公开(公告)日: | 2021-06-04 |
发明(设计)人: | 曾启文;刘昕;况铁梅;冯林;姚琪 | 申请(专利权)人: | 咪咕文化科技有限公司;中国移动通信集团有限公司 |
主分类号: | G06F16/435 | 分类号: | G06F16/435;G06N20/00 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 王姗姗;张颖玲 |
地址: | 100032 北京市西城区德*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 多媒体 信息处理 方法 装置 存储 介质 | ||
1.一种多媒体信息处理方法,其特征在于,所述方法包括:
获取第一类多媒体文件的数据;
对所述数据进行用于适配机器学习模型的预处理;
在所述机器学习模型中,根据经过预处理的数据确定用户对所述第一类多媒体文件的兴趣度;
所述对所述数据进行用于适配机器学习模型的预处理,包括:
将所述数据中第一时间间隔内的使用数据划分为至少四个第一数据集,且每两个第一数据集之间的时间间隔为固定值;
按照第一压缩比对所述第一数据集利用反幂指抽样压缩数据的方式进行第一合并处理,得到至少两个第二数据集;
按照第二压缩比对所述第二数据集利用反幂指抽样压缩数据的方式进行第二合并处理,得到至少一个第三数据集。
2.根据权利要求1所述的方法,其特征在于,所述获取第一类多媒体文件的数据,包括:
获取第一时间间隔内,至少两个用户对所述第一类多媒体文件的数据。
3.根据权利要求1或2所述的方法,其特征在于,所述数据包括下述中的至少一项:
所述第一类多媒体文件的使用数据;
所述第一类多媒体文件中的至少两个多媒体文件的属性数据。
4.根据权利要求1所述的方法,其特征在于,所述对所述数据进行用于适配机器学习模型的预处理,包括:
基于多媒体文件标识ID,将所述第三数据集划分为至少两个第四数据集;
基于用户对所述第一类多媒体文件不同维度的操作,将所述第四数据集划分为相应维度的第四数据子集;
对所述第四数据子集进行处理,获取所述第四数据子集对应的属性。
5.根据权利要求4所述的方法,其特征在于,所述对所述数据进行用于适配机器学习模型的预处理,包括:
对所述第四数据子集进行反向合并处理,获得表征用户在第一时间点对所述第一类多媒体文件的行为属性的第五数据集、以及表征用户在第二时间段对所述第一类多媒体文件的行为属性的第六数据集。
6.根据权利要求5所述的方法,其特征在于,所述根据经过预处理的数据确定用户对所述第一类多媒体文件的兴趣度,包括:
基于所述第五数据集确定所述机器学习模型;
基于所述第六数据集和所述机器学习模型,确定用户对所述第一类多媒体文件的兴趣度。
7.一种多媒体信息处理装置,其特征在于,所述装置包括:
获取单元,用于获取第一类多媒体文件的数据;
处理单元,用于对所述数据进行用于适配机器学习模型的预处理;
确定单元,用于在所述机器学习模型中,根据经过预处理的数据确定用户对所述第一类多媒体文件的兴趣度;
所述处理单元,用于:
将所述数据中第一时间间隔内的使用数据划分为至少四个第一数据集,且每两个第一数据集之间的时间间隔为固定值;
按照第一压缩比对所述第一数据集利用反幂指抽样压缩数据的方式进行第一合并处理,得到至少两个第二数据集;
按照第二压缩比对所述第二数据集利用反幂指抽样压缩数据的方式进行第二合并处理,得到至少一个第三数据集。
8.一种多媒体信息处理装置,其特征在于,包括处理器和用于存储能够在处理器上运行的计算机程序的存储器,其中,
所述处理器用于运行所述计算机程序时,执行权利要求1至6任一项所述的多媒体信息处理方法的步骤。
9.一种存储介质,存储有可执行程序,所述可执行程序被处理器执行时,实现权利要求1至6任一项所述的多媒体信息处理方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于咪咕文化科技有限公司;中国移动通信集团有限公司,未经咪咕文化科技有限公司;中国移动通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811627152.9/1.html,转载请声明来源钻瓜专利网。