[发明专利]基于多模态特征的影视专题自动生成方法在审
申请号: | 202011565739.9 | 申请日: | 2020-12-25 |
公开(公告)号: | CN112597765A | 公开(公告)日: | 2021-04-02 |
发明(设计)人: | 吴上波 | 申请(专利权)人: | 四川长虹电器股份有限公司 |
主分类号: | G06F40/284 | 分类号: | G06F40/284;G06F16/35;G06K9/62;G06N3/08 |
代理公司: | 成都虹桥专利事务所(普通合伙) 51124 | 代理人: | 吴中伟 |
地址: | 621000 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 多模态 特征 影视 专题 自动 生成 方法 | ||
1.基于多模态特征的影视专题自动生成方法,其特征在于,包括以下步骤:
S01、将影视的海报图片预处理成统一尺寸,利用卷积神经网络的表征学习能力提取影视海报的图形特征向量;
S02、将影视的文本信息进行分词提取构建关键词词库,并计算每个关键词的反文档频率IDF,将影视信息中的关键词进行one-hot编码生成影视的文本向量,使用tf-idf对文本向量进行加权,获取得到加权的文本特征向量;
S03、将用户的行为整合成分段的语料集,整合所有用户的语料集生成word2vec词向量模型训练样本,建立词向量模型,利用skip-gram对词向量模型训练,生成每个影视的词特征向量;
S04、将图形特征向量、文本特征向量和词特征向量进行拼接,生成影视多模态向量,利用无监督聚类算法进行聚类分析;
S05、获得多模态特征的影视专题。
2.根据权利要求1所述的基于多模态特征的影视专题自动生成方法,其特征在于,步骤S02中,影视的文本信息包括名称、简介、题材、评论、年代、地区、导演和演员。
3.根据权利要求1所述的基于多模态特征的影视专题自动生成方法,其特征在于,步骤S03中,用户行为包括连续影视浏览行为、影视搜索行为和观影行为。
4.根据权利要求1所述的基于多模态特征的影视专题自动生成方法,其特征在于,步骤S04中,所述无监督聚类算法是K-Means算法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川长虹电器股份有限公司,未经四川长虹电器股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011565739.9/1.html,转载请声明来源钻瓜专利网。