[发明专利]一种针对多模态数据离散语义编码的装置和方法在审
申请号: | 202111150268.X | 申请日: | 2021-09-29 |
公开(公告)号: | CN113837301A | 公开(公告)日: | 2021-12-24 |
发明(设计)人: | 赵天成 | 申请(专利权)人: | 宏龙科技(杭州)有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 杭州知见专利代理有限公司 33295 | 代理人: | 卢金元 |
地址: | 310000 浙江省杭州市滨江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 针对 多模态 数据 离散 语义 编码 装置 方法 | ||
本发明公开了一种针对多模态数据离散语义编码的装置和方法,方法包括以下步骤:S1、数据编码器的输入数据为x,采用LSTM对于文本数据进行编码,采用CNN模型对于图片进行编码,输出结果为一个多维张量h;S2、将h中代表现实意义的维度作为主要坐标输入Transfomer,然后经过数层Transfomer计算后,用Transfomer的前M个维度预测q(z|h)。本方案通过新的损失函数实现数据编码z的离散化,保证z包含丰富的信息,最大程度的保留原始数据中的信息点。
技术领域
本发明涉及人工智能领域,尤其是涉及针对多模态数据离散语义编码的装置和方法。
背景技术
将多模态数据转换为离散编码在许多行业有着重大意义。首先因为离散变量相较于连续的模拟数据占据更小的空间,因此可以大大的节省数据存储的空间,对于数据湖、物联网和边缘计算领域有着很高的作用,大大节省成本。其次,对于离散编码可以更加高效的被检索,因此对于大规模的信息(图片、文本、视频等)信息检索,离散编码有着巨大的优势。最后,离散编码相较于连续的向量有着更好的可读性,对于促进科研人员理解人工智能系统,进行人工智能决策优化有着重要的作用。
发明内容
本发明主要是提供一种针对多模态数据离散语义编码的方法和装置,对原始数据中的信息点有较好的保留。
本发明针对上述技术问题主要是通过下述技术方案得以解决的:一种针对多模态数据离散语义编码的装置,包括:
数据编码器:对输入数据x编码,输出结果为一个多维张量h;
编码生成器:根据张量h生成M个K维的离散变量z的概率分布q(z|h),离散变量有M个,每个离散变量均为K维;
针对给定张量h,编码生成器是一套神经网络,基于M个K维的离散变量生成概率分布作为编码结果q(z|h);同时针对每一个维度,每个不同的变量,编码器包括离散符号和嵌入向量,嵌入向量的维数为D,嵌入向量为M×D的矩阵;编码器生成的输出包含两部分,第一部分是M个离散符号,另外是M个相对应的嵌入向量e(z),大小为e(z)∈RM×D;将h中代表现实意义的维度作为主要坐标输入Transfomer模型,然后经过数层Transfomer计算后,用Transfomer模型的前M个输出作为q(z|h)。
一种针对多模态数据离散语义编码的方法,基于前述的编码装置,包括以下步骤:
S1、通过数据编码器对输入数据进行编码,输出结果为多维张量h;
S2、将h中代表现实意义的维度作为主要坐标输入Transfomer模型,然后经过若干层(一般为12层)Transfomer计算后,用Transfomer模型的前M个输出作为q(z|h)。
作为优选,步骤S1中,对于文本数据采用LSTM进行编码,对于图片文件采用CNN模型进行编码。
作为优选,步骤S2中,h中代表现实意义的维度包括文字中的时间轴和图片中的方位信息。
作为优选,一种针对多模态数据离散语义编码的方法还包括对模型的训练方法,训练方法采用的损失函数为:
式中,q(z)按以下方式进行仿真:
式中,LVAE为ELBO损失函数,I(Z,X)为最大互信息损失,qqФ(z|x)为编码器模型,p(x)为x的边际分布,ppФ(x|z)为解码器模型,KL为K-L距离,q(z)为拟似的z的边际分布,p(z)为z的边际分布,N为一个训练集的数据数量;
训练时,得到编码结果以后通过解码器重建原始数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宏龙科技(杭州)有限公司,未经宏龙科技(杭州)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111150268.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种低介电高粘度LCP材料的制备方法
- 下一篇:一种工程用脚手架
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置