[发明专利]一种基于深度神经网络影视标签自动获取方法有效

专利信息
申请号: 201910627545.8 申请日: 2019-07-12
公开(公告)号: CN110516086B 公开(公告)日: 2022-05-03
发明(设计)人: 宣琦;王冠华;俞山青;孙佳慧;韩忙;孙翊杰 申请(专利权)人: 浙江工业大学
主分类号: G06F16/483 分类号: G06F16/483;G06N3/04;G06N3/08
代理公司: 杭州斯可睿专利事务所有限公司 33241 代理人: 王利强
地址: 310014 浙江省*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 深度 神经网络 影视 标签 自动 获取 方法
【说明书】:

一种基于深度神经网络影视标签自动获取方法,包括以下步骤:步骤1:收集电影的台词,构建台词数据集;步骤2:收集电影原声,构建声音数据集;步骤3:在相关影视平台收集其所生成的标签,构建电影标签数据集;步骤4:构建基于电影台词的自动打标签模型;步骤5:采用共享节点的CNN‑LSTM算法构建基于电影原声的自动打标签模型;步骤6:融合步骤4与步骤5所提及的两种模型。本发明提出一种基于深度神经网络影视标签自动获取方法,采用了以卷积神经网络和循环神经网络为代表的深度学习算法,主要针对电影,利用电影在时间上的相关性从电影的台词文本、音频信号等原始信息中提取出高层抽象属性。

技术领域

本发明涉及数据挖掘、网络科学、深度神经网络,特别是涉及一种基于深度神经网络影视标签自动获取方法。

背景技术

随着信息化社会和数字化社会的深入发展,影视行业越来越倾向于通过流媒体服务和在线影视商店进行数字分销。《2018全球影视报告》显示全球影视市场规模在2017年增长了5.9%,其中数字影视市场收入的增长高达17.7%。2017年数字影视市场收入的增长第一次超过了整体影视市场年收入的一半,这一现象显然值得关注。报告指出在影视下载市场和实体影碟市场双双萎缩的背景下流媒体服务的收入猛增60.4%,这说明数字影视市场收入大幅增长的最主要推动力正是流媒体服务。目前全世界在线影视付费服务的订阅用户总量己经超过了1亿,这个重要的里程碑代表着流媒体服务己经成为数字影视市场的重大组成部分。同时中国的影视产业被认为具有很大的发展潜力,根据报告2017年中国影视市场的规模扩大了20.3%,其中流媒体服务的收入增长了30.6%,涨幅大于整体影视市场。中国最主要的流媒体服务商腾讯影视娱乐拥有多个影视平台和超过1500万的付费用户,可以说中国的数字影视市场即将成长为全世界重要的数字影视市场之一。

高速移动网络和智能设备的普及让消费者的影视消费习惯从实体和下载转向了流媒体。新的背景下全世界的数字影视市场都存在着激烈的竞争,影视流媒体服务商都在持续开发和扩展各自的产品和服务以为消费者提供更加多样化和更加个性化的体验。面对拥有海量数字影视资源的巨大的在线影视库,如何进行更高效的组织,如何提供更高质的订阅,如何推荐更精准的内容,成为各大流媒体服务商关注的重要技术热点。

在影视市场的转型背景下,作为结构化的影视信息组织方式,影视标签这一概念的重要性凸现,通过各种先进技术提升影视标注任务的效果己经成为影视信息检索领域的热门方向。影视标签是指能对高层次的影视语义进行准确描述的短语,由于影视的特殊性,台词和声音很难使用常规方式进行管理和检索,代表影视特性的标签对影视的分类、组织和检索都有很大的帮助。自然语言标签可以帮助用户通过关键词、列表和标签云查找特定属性的影视。在此基础上,流媒体服务商也可以利用影视的标签信息进行个性化推荐,这种基于影视自身内容和特性的方式可以帮助克服在目前市场上广泛使用的协同过滤推荐算法面临的冷启动问题。

目前有三种主流方法来完成影视标注任务,分别是专家标注、社会化标注与算法自动标注。专家标注是指影视行业内专业人士基于专业的影视知识和自身的素养对影视进行标注,专家给出的影视标签较为准确,但是该标注方式的成本高、内容也不够丰富。而社会化标注是指通过类似众筹任务的方式,鼓励用户根据个人对影视的理解和感受进行无限制或半限制的标注,采集大量用户的标注数据进行处理和统计生成标签。这种方法的好处是成本较低、内容丰富,但是由于不同用户对影视的理解和感受较为主观,标注结果参差不齐,甚至同一影视会出现语义完全相反的标签,导致结果噪声很大。自动标注是指在现有的小规模影视标签数据集上,从音频信号、台词文本、相关评论、海报等各类影视的自身和相关信息中提取特征训练分类模型,对大规模的影视数据自动生成标签结果。利用算法基于内容自动标注影视标签既能解决成本和时间问题,也能解决标注方法的普适性问题。目前自动标注方法的准确率和适用范围仍然有较大的提高空间,因此利用影视内容来进行影视自动标注的研究受到了越来越多的关注。

综上,传统的标注标签算法中存在的很多亟待解决的问题,包括特征设计过程中的噪声以及分类器浅层结构的限制,尚无有效的解决办法。

发明内容

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910627545.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top