[发明专利]一种基于多模态信息融合理解的全媒体新闻智能编目方法有效

专利信息
申请号: 202110198428.1 申请日: 2021-02-22
公开(公告)号: CN112818906B 公开(公告)日: 2023-07-11
发明(设计)人: 张随雨;俞定国;方莉萍;钱永江;王亚奇;马小雨 申请(专利权)人: 浙江传媒学院
主分类号: G06V40/16 分类号: G06V40/16;G06V10/74;G06V10/80;G06V10/77;G06V10/82;G06N3/0464;G06N3/049;G06N3/08
代理公司: 杭州求是专利事务所有限公司 33200 代理人: 陈升华
地址: 310018 浙江省*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 多模态 信息 融合 理解 媒体 新闻 智能 编目 方法
【权利要求书】:

1.一种基于多模态信息融合理解的全媒体新闻智能编目方法,其特征在于,包括以下步骤:

1)获取原始新闻视频,分割镜头片段并定位场景关键帧;

2)生成多个切片片段,具体包括:

A)通过已训练的用于新闻场景分类任务的残差网络来提取各个场景关键帧的视觉特征并推理获得最高匹配度的面向新闻场景的场景分类标签;

B)基于步骤A)中获得的各个片段的场景分类标签进行相邻同场景合并处理;

C):将步骤B)处理后仍保留的镜头边界标记作为新闻视频的切片标记,将相邻镜头边界标记之间的帧序列作为一个切片片段,生成多个切片片段;

3)对步骤2)获得的切片片段进行视觉特征提取并生成新闻描述文本;

4)对步骤2)获得的切片片段进行语音识别获得语音文本;

5)抽取步骤2)获得的切片片段的图像帧识别获得字幕条文本;

6)识别步骤2)获得的切片片段中的人脸特征并在新闻人物库中进行匹配,得到人物信息文本;

7)将步骤3)得到的新闻描述文本、步骤4)得到的语音文本、步骤5)得到的字幕条文本、步骤6)得到的人物信息文本,输入到多模态融合的生成模型处理,生成新闻关键词及综合编目描述,经过整理和组装后输出,完成新闻智能编目;

多模态融合的生成模型处理,具体包括:

将新闻描述文本、语音文本、字幕条文本和人物信息文本输入到已通过新闻语料文本训练的嵌入层中,使文本转化为语义特征向量,然后将这些向量通过统一映射层分别映射到统一的语义空间中,接着将统一语义空间中的向量传入新闻语义融合层进行融合理解以获得消除了冗余信息的新闻融合特征,最后将新闻融合特征通过已训练的文本解码层来生成综合编目描述以及新闻关键词的关键度;

所述的多模态融合的生成模型采用以下公式:

文本嵌入:Vx=x1v1+x2v2+…+xnvn

式中:xi为被嵌入文本基于嵌入字典的One-hot编码的第i位,n为嵌入字典的维度;vi为该文本对应嵌入字典中的向量行;Vx为该文本嵌入后的向量;

统一映射:

式中:A,b和f(·)分别表示映射层权重矩阵、偏置向量和激活函数;k为输入向量x的维度;m为映射后的统一域的向量维度;

语义融合:

式中:xi为模态i在统一语义空间中的向量,wi为xi对应的新闻语义权重系数;A,b和f(·)分别表示融合层的末层的权重矩阵、偏置向量和激活函数;

文本解码:该过程由多个长短期记忆网络堆叠实现:

L1=LSTM1(R)

Li+1=LSTMi+1(Li)

C(Li)=f(Li;W,b)

Outputtext=[OL1,OL2,OL3,…]

Outputcriticality=[C(L1),C(L2),C(L3),…]

式中:R为融合后的特征向量;LSTMi+1(·)为第i+1个长短期记忆网络的函数表示,它的特征输出为Li+1,文本输出为OLi+1;f(·;W,b)为关键度运算的函数表示,其中W,b分别为承担该运算的层的权重矩阵与偏置向量,基于Li运算获得的关键度表示为C(Li);Outputtext为最终生成的完整文本描述,它是各个长短期记忆网络的文本输出所组成的队列;Outputcriticality为文本描述中各个词对应的关键度所组成的队列。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江传媒学院,未经浙江传媒学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110198428.1/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top