[发明专利]一种基于多模态信息融合理解的全媒体新闻智能编目方法有效
| 申请号: | 202110198428.1 | 申请日: | 2021-02-22 |
| 公开(公告)号: | CN112818906B | 公开(公告)日: | 2023-07-11 |
| 发明(设计)人: | 张随雨;俞定国;方莉萍;钱永江;王亚奇;马小雨 | 申请(专利权)人: | 浙江传媒学院 |
| 主分类号: | G06V40/16 | 分类号: | G06V40/16;G06V10/74;G06V10/80;G06V10/77;G06V10/82;G06N3/0464;G06N3/049;G06N3/08 |
| 代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 陈升华 |
| 地址: | 310018 浙江省*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 多模态 信息 融合 理解 媒体 新闻 智能 编目 方法 | ||
1.一种基于多模态信息融合理解的全媒体新闻智能编目方法,其特征在于,包括以下步骤:
1)获取原始新闻视频,分割镜头片段并定位场景关键帧;
2)生成多个切片片段,具体包括:
A)通过已训练的用于新闻场景分类任务的残差网络来提取各个场景关键帧的视觉特征并推理获得最高匹配度的面向新闻场景的场景分类标签;
B)基于步骤A)中获得的各个片段的场景分类标签进行相邻同场景合并处理;
C):将步骤B)处理后仍保留的镜头边界标记作为新闻视频的切片标记,将相邻镜头边界标记之间的帧序列作为一个切片片段,生成多个切片片段;
3)对步骤2)获得的切片片段进行视觉特征提取并生成新闻描述文本;
4)对步骤2)获得的切片片段进行语音识别获得语音文本;
5)抽取步骤2)获得的切片片段的图像帧识别获得字幕条文本;
6)识别步骤2)获得的切片片段中的人脸特征并在新闻人物库中进行匹配,得到人物信息文本;
7)将步骤3)得到的新闻描述文本、步骤4)得到的语音文本、步骤5)得到的字幕条文本、步骤6)得到的人物信息文本,输入到多模态融合的生成模型处理,生成新闻关键词及综合编目描述,经过整理和组装后输出,完成新闻智能编目;
多模态融合的生成模型处理,具体包括:
将新闻描述文本、语音文本、字幕条文本和人物信息文本输入到已通过新闻语料文本训练的嵌入层中,使文本转化为语义特征向量,然后将这些向量通过统一映射层分别映射到统一的语义空间中,接着将统一语义空间中的向量传入新闻语义融合层进行融合理解以获得消除了冗余信息的新闻融合特征,最后将新闻融合特征通过已训练的文本解码层来生成综合编目描述以及新闻关键词的关键度;
所述的多模态融合的生成模型采用以下公式:
文本嵌入:Vx=x1v1+x2v2+…+xnvn;
式中:xi为被嵌入文本基于嵌入字典的One-hot编码的第i位,n为嵌入字典的维度;vi为该文本对应嵌入字典中的向量行;Vx为该文本嵌入后的向量;
统一映射:
式中:A,b和f(·)分别表示映射层权重矩阵、偏置向量和激活函数;k为输入向量x的维度;m为映射后的统一域的向量维度;
语义融合:
式中:xi为模态i在统一语义空间中的向量,wi为xi对应的新闻语义权重系数;A,b和f(·)分别表示融合层的末层的权重矩阵、偏置向量和激活函数;
文本解码:该过程由多个长短期记忆网络堆叠实现:
L1=LSTM1(R)
Li+1=LSTMi+1(Li)
C(Li)=f(Li;W,b)
Outputtext=[OL1,OL2,OL3,…]
Outputcriticality=[C(L1),C(L2),C(L3),…]
式中:R为融合后的特征向量;LSTMi+1(·)为第i+1个长短期记忆网络的函数表示,它的特征输出为Li+1,文本输出为OLi+1;f(·;W,b)为关键度运算的函数表示,其中W,b分别为承担该运算的层的权重矩阵与偏置向量,基于Li运算获得的关键度表示为C(Li);Outputtext为最终生成的完整文本描述,它是各个长短期记忆网络的文本输出所组成的队列;Outputcriticality为文本描述中各个词对应的关键度所组成的队列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江传媒学院,未经浙江传媒学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110198428.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种清雪机机架
- 下一篇:一种拉丝润滑粉加工生产用定量投料装置
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置





