[发明专利]一种针对多模态数据离散语义编码的装置和方法在审

专利信息
申请号: 202111150268.X 申请日: 2021-09-29
公开(公告)号: CN113837301A 公开(公告)日: 2021-12-24
发明(设计)人: 赵天成 申请(专利权)人: 宏龙科技(杭州)有限公司
主分类号: G06K9/62 分类号: G06K9/62;G06N3/04;G06N3/08
代理公司: 杭州知见专利代理有限公司 33295 代理人: 卢金元
地址: 310000 浙江省杭州市滨江*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 针对 多模态 数据 离散 语义 编码 装置 方法
【说明书】:

发明公开了一种针对多模态数据离散语义编码的装置和方法,方法包括以下步骤:S1、数据编码器的输入数据为x,采用LSTM对于文本数据进行编码,采用CNN模型对于图片进行编码,输出结果为一个多维张量h;S2、将h中代表现实意义的维度作为主要坐标输入Transfomer,然后经过数层Transfomer计算后,用Transfomer的前M个维度预测q(z|h)。本方案通过新的损失函数实现数据编码z的离散化,保证z包含丰富的信息,最大程度的保留原始数据中的信息点。

技术领域

本发明涉及人工智能领域,尤其是涉及针对多模态数据离散语义编码的装置和方法。

背景技术

将多模态数据转换为离散编码在许多行业有着重大意义。首先因为离散变量相较于连续的模拟数据占据更小的空间,因此可以大大的节省数据存储的空间,对于数据湖、物联网和边缘计算领域有着很高的作用,大大节省成本。其次,对于离散编码可以更加高效的被检索,因此对于大规模的信息(图片、文本、视频等)信息检索,离散编码有着巨大的优势。最后,离散编码相较于连续的向量有着更好的可读性,对于促进科研人员理解人工智能系统,进行人工智能决策优化有着重要的作用。

发明内容

本发明主要是提供一种针对多模态数据离散语义编码的方法和装置,对原始数据中的信息点有较好的保留。

本发明针对上述技术问题主要是通过下述技术方案得以解决的:一种针对多模态数据离散语义编码的装置,包括:

数据编码器:对输入数据x编码,输出结果为一个多维张量h;

编码生成器:根据张量h生成M个K维的离散变量z的概率分布q(z|h),离散变量有M个,每个离散变量均为K维;

针对给定张量h,编码生成器是一套神经网络,基于M个K维的离散变量生成概率分布作为编码结果q(z|h);同时针对每一个维度,每个不同的变量,编码器包括离散符号和嵌入向量,嵌入向量的维数为D,嵌入向量为M×D的矩阵;编码器生成的输出包含两部分,第一部分是M个离散符号,另外是M个相对应的嵌入向量e(z),大小为e(z)∈RM×D;将h中代表现实意义的维度作为主要坐标输入Transfomer模型,然后经过数层Transfomer计算后,用Transfomer模型的前M个输出作为q(z|h)。

一种针对多模态数据离散语义编码的方法,基于前述的编码装置,包括以下步骤:

S1、通过数据编码器对输入数据进行编码,输出结果为多维张量h;

S2、将h中代表现实意义的维度作为主要坐标输入Transfomer模型,然后经过若干层(一般为12层)Transfomer计算后,用Transfomer模型的前M个输出作为q(z|h)。

作为优选,步骤S1中,对于文本数据采用LSTM进行编码,对于图片文件采用CNN模型进行编码。

作为优选,步骤S2中,h中代表现实意义的维度包括文字中的时间轴和图片中的方位信息。

作为优选,一种针对多模态数据离散语义编码的方法还包括对模型的训练方法,训练方法采用的损失函数为:

式中,q(z)按以下方式进行仿真:

式中,LVAE为ELBO损失函数,I(Z,X)为最大互信息损失,q(z|x)为编码器模型,p(x)为x的边际分布,p(x|z)为解码器模型,KL为K-L距离,q(z)为拟似的z的边际分布,p(z)为z的边际分布,N为一个训练集的数据数量;

训练时,得到编码结果以后通过解码器重建原始数据。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宏龙科技(杭州)有限公司,未经宏龙科技(杭州)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111150268.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top