[发明专利]基于多模态特征的影视专题自动生成方法在审
申请号: | 202011565739.9 | 申请日: | 2020-12-25 |
公开(公告)号: | CN112597765A | 公开(公告)日: | 2021-04-02 |
发明(设计)人: | 吴上波 | 申请(专利权)人: | 四川长虹电器股份有限公司 |
主分类号: | G06F40/284 | 分类号: | G06F40/284;G06F16/35;G06K9/62;G06N3/08 |
代理公司: | 成都虹桥专利事务所(普通合伙) 51124 | 代理人: | 吴中伟 |
地址: | 621000 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 多模态 特征 影视 专题 自动 生成 方法 | ||
本发明涉及影视专题领域,特别涉及基于多模态特征的影视专题自动生成方法,本发明基于多模态特征的影视专题自动生成方法利用卷积神经网络对影视海报进行学习达到了视觉风格统一的目的,通过无监督聚类算法将图形特征向量、文本特征向量和词特征向量结合生成影视专题提高了影视专题关联度解决了影视专题内影视海报视觉风格不统一和影视关联度不高的问题,本发明适用于影视专题生成。
技术领域
本发明涉及影视专题领域,特别涉及基于多模态特征的影视专题自动生成方法。
背景技术
影视专题自动生成的方法一般采用传统的机器学习算法,利用影视的文本特征如导演、演员、题材、年代、地域等,进行无监督聚类生成影视专题,这种方法生成的影视专题,专题内影视海报视觉风格不统一,专题内影视关联度不高,造成用户体验不佳,造成该问题的原因是模型无法对影视海报的图形特征进行学习,无法对用户间的行为进行分析。
发明内容
本发明所解决的技术问题:提供基于多模态特征的影视专题自动生成方法解决影视专题内影视海报视觉风格不统一和影视关联度不高的问题。
本发明解决上述技术问题采用的技术方案:基于多模态特征的影视专题自动生成方法包括以下步骤:
S01、将影视的海报图片预处理成统一尺寸,利用卷积神经网络的表征学习能力提取影视海报的图形特征向量;
S02、将影视的文本信息进行分词提取构建关键词词库,并计算每个关键词的反文档频率IDF,将影视信息中的关键词进行one-hot编码生成影视的文本向量,使用tf-idf对文本向量进行加权,获取得到加权的文本特征向量;
S03、将用户的行为整合成分段的语料集,整合所有用户的语料集生成word2vec词向量模型训练样本,建立词向量模型,利用skip-gram对词向量模型训练,生成每个影视的词特征向量;
S04、将图形特征向量、文本特征向量和词特征向量进行拼接,生成影视多模态向量,利用无监督聚类算法进行聚类分析;
S05、获得多模态特征的影视专题。
进一步的,步骤S02中,影视的文本信息包括名称、简介、题材、评论、年代、地区、导演和演员。
进一步的,步骤S03中,用户行为包括连续影视浏览行为、影视搜索行为和观影行为。
进一步的,步骤S04中,所述无监督聚类算法是K-Means算法。
本发明的有益效果:本发明基于多模态特征的影视专题自动生成方法利用卷积神经网络对影视海报进行学习达到了视觉风格统一的目的,通过无监督聚类算法将图形特征向量、文本特征向量和词特征向量结合生成影视专题提高了影视专题关联度,增强了用户在浏览影视专题内容时的体验感。
附图说明
附图1是本发明基于多模态特征的影视专题自动生成方法的流程图。
附图2是本发明基于多模态特征的影视专题自动生成方法的卷积神经网络神经元参数图。
具体实施方式
本发明提供基于多模态特征的影视专题自动生成方法,本发明基于多模态特征的影视专题自动生成方法利用卷积神经网络对影视海报进行学习达到了视觉风格统一的目的,通过无监督聚类算法将图形特征向量、文本特征向量和词特征向量结合生成影视专题提高了影视专题关联度,包括以下步骤:
S01、将影视的海报图片预处理成统一尺寸,利用卷积神经网络的表征学习能力提取影视海报的图形特征向量;
S02、将影视的文本信息进行分词提取构建关键词词库,并计算每个关键词的反文档频率IDF,将影视信息中的关键词进行one-hot编码生成影视的文本向量,使用tf-idf对文本向量进行加权,获取得到加权的文本特征向量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川长虹电器股份有限公司,未经四川长虹电器股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011565739.9/2.html,转载请声明来源钻瓜专利网。