[发明专利]多模态的融合方法、装置、设备及介质在审

专利信息
申请号: 202310145041.9 申请日: 2023-02-17
公开(公告)号: CN116204848A 公开(公告)日: 2023-06-02
发明(设计)人: 舒畅;陈又新 申请(专利权)人: 平安科技(深圳)有限公司
主分类号: G06F18/25 分类号: G06F18/25;G06N3/0455;G06N3/08
代理公司: 深圳市明日今典知识产权代理事务所(普通合伙) 44343 代理人: 王杰辉;宋莉
地址: 518000 广东省深圳市福田区福*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 多模态 融合 方法 装置 设备 介质
【权利要求书】:

1.一种多模态的融合方法,其特征在于,包括:

获取多个待融合的模态;

将各个所述待融合的模态经过编码器进行编码,得到各个所述待融合的模态对应的特征向量;

对所述特征向量进行预处理,得到各个所述特征向量的目标特征向量;其中预处理的方式为对所述特征向量进行增加或者减少维度;

根据各个所述目标特征向量对应的维度为每个所述目标特征向量设置多个权重矩阵;其中,所述权重矩阵的横列数量与所述目标特征向量的纵列数量相同,各个所述权重矩阵的纵列数量为预设值;

将各个所述目标特征向量与对应的多个所述权重矩阵相乘,得到各个所述目标特征向量分别对应的多个暂时向量,其中,所述暂时向量的数量与所述权重矩阵相同;

将各个所述目标特征向量对应的多个所述暂时向量进行逐元素相加,得到各个所述目标特征向量对应的且纵列数量为预设值的模态向量;

将所述模态向量进行融合操作,得到多个模态对应的总向量。

2.如权利要求1所述的多模态的融合方法,其特征在于,所述对所述特征向量进行预处理,得到各个所述特征向量的目标特征向量的步骤,包括:

对所述特征向量的最后一个位置增加一个标量为1的维度,得到目标特征向量。

3.如权利要求1所述的多模态的融合方法,其特征在于,所述将所述模态向量进行融合操作,得到多个模态对应的总向量的步骤,包括:

将各个模态向量进行向量内积操作,得到多个模态对应的总向量。

4.如权利要求1所述的多模态的融合方法,其特征在于,所述将所述模态向量进行融合操作,得到多个模态对应的总向量的步骤,包括:

将各个模态向量进行向量拼接,得到拼接向量;

将所述拼接向量输入全连接层,在全连接层乘以n×m*m的权重,得到总向量;其中,n为模态向量的个数,m为所述预设值。

5.如权利要求1所述的多模态的融合方法,其特征在于,所述将各个所述待融合的模态经过编码器进行编码,得到各个所述待融合的模态对应的特征向量的步骤,包括:

获取各个模态的表现形式;其中表现形式至少包括文本、图像、语音三种表现形式;

根据各个模态的表现形式设置对应的编码器;

利用对应的编码器对各个模态进行编码,得到各个模态对应的特征向量。

6.如权利要求1所述的多模态的融合方法,其特征在于,所述将所述模态向量进行融合操作,得到多个模态对应的总向量的步骤之后,还包括:

获取多模态数据样本,其中所述多模态数据样本包括多个总向量以及对应的实际识别结果;

将各个总向量输入至预设的神经网络模型进行识别,得到预测识别结果;

根据实际识别结果和预测识别计算各个所述多模态数据样本的损失函数;

通过预设的参数调整策略,利用各个所述多模态数据样本的损失函数,对所述神经网络模型的参数进行更新和/或对生成的权重矩阵进行更新。

7.一种多模态的融合装置,其特征在于,包括:

获取模块,用于获取多个待融合的模态;

编码模块,用于将各个所述待融合的模态经过编码器进行编码,得到各个所述待融合的模态对应的特征向量;

预处理模块,用于对所述特征向量进行预处理,得到各个所述特征向量的目标特征向量;其中预处理的方式为对所述特征向量进行增加或者减少维度;

设置模块,用于根据各个所述目标特征向量对应的维度为每个所述目标特征向量设置多个权重矩阵;其中,所述权重矩阵的横列数量与所述目标特征向量的纵列数量相同,各个所述权重矩阵的纵列数量为预设值;

相乘模块,用于将各个所述目标特征向量与对应的多个所述权重矩阵相乘,得到各个所述目标特征向量分别对应的多个暂时向量,其中,所述暂时向量的数量与所述权重矩阵相同;

相加模块,用于将各个所述目标特征向量对应的多个所述暂时向量进行逐元素相加,得到各个所述目标特征向量对应的且纵列数量为预设值的模态向量;

融合模块,用于将所述模态向量进行融合操作,得到多个模态对应的总向量。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202310145041.9/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top