[发明专利]一种用于提供视频节目内容总结的方法及其系统有效
申请号: | 201911376389.9 | 申请日: | 2019-12-27 |
公开(公告)号: | CN111083558B | 公开(公告)日: | 2022-08-30 |
发明(设计)人: | 李小波;贾凡 | 申请(专利权)人: | 恒信东方文化股份有限公司 |
主分类号: | H04N21/435 | 分类号: | H04N21/435;H04N21/8549;G06F16/74;G06F16/31;G06V20/40 |
代理公司: | 北京卓特专利代理事务所(普通合伙) 11572 | 代理人: | 陈变花 |
地址: | 100007 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 提供 视频 节目内容 总结 方法 及其 系统 | ||
1.一种用于提供视频节目内容总结的方法,包括如下步骤:
提取视频台词文字,整合成txt文本;
将非结构化文本转变为结构化数据;
提取结构化数据中的关键信息;
将关键信息和所述视频相关联;
将关键信息保存为语音形式;
获取所述视频的背景图片;
将关键信息和背景图片相关联;
其中提取结构化数据的关键信息包括如下子步骤:
对结构化数据进行要素分析;
提取要素点;
将要素点进行整合,形成关键信息。
2.如权利要求1所述的方法,其中利用自然语言处理技术进行词性分析、词性标注,将非结构化文本转变为结构化数据。
3.如权利要求1所述的方法,其中将关键信息保存为语音形式包括将关键信息输入语音转换模块获得关键信息对应的音频文件。
4.如权利要求3所述的方法,其中语音转换模块基于深度神经网络,预先训练所述深度神经网络,包括如下子步骤:
构造训练样本库,其中训练样本库包括训练文本,以及所述训练文本的样本音频信息;
构建深度神经网络,找到隐藏层最佳神经元个数;
将训练文本作为所述深度神经网络的输入,获得音频信息;
构造所述音频信息的特征矩阵Ti和所述样本音频信息的特征矩阵Ti’;
根据Ti和Ti’确定音频差异度αi;
根据所有音频差异度αi确定总的音频差异度β;
在β小于所述深度神经网络的最小均方误差目标时训练结束。
5.如权利要求4所述的方法,其中音频差异度使用如下公式计算:
αi=Ti-Ti'。
6.如权利要求5所述的方法,其中总的音频差异度β使用如下公式计算:
其中n是输入深度神经网络的训练文本总个数。
7.如权利要求1所述的方法,其中抽取所述视频的关键帧作为背景图片。
8.如权利要求7所述的方法,其中抽取所述视频的关键帧作为背景图片包括如下步骤:
从结构化数据中抽取关键词;
根据关键词词频确定视频类型;
查询类型库,依据类型库获得抽取信息;
依据抽取信息抽取视频的关键帧,作为背景图片。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于恒信东方文化股份有限公司,未经恒信东方文化股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911376389.9/1.html,转载请声明来源钻瓜专利网。