[发明专利]数据处理方法、装置及电子设备有效
| 申请号: | 201811604698.2 | 申请日: | 2018-12-26 |
| 公开(公告)号: | CN111368992B | 公开(公告)日: | 2023-08-22 |
| 发明(设计)人: | 王路路;陈冠豪;孟晓楠 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
| 主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/04 |
| 代理公司: | 广州铸智知识产权代理有限公司 44886 | 代理人: | 徐瑞红 |
| 地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 数据处理 方法 装置 电子设备 | ||
1.一种数据处理方法,该方法应用于语义分析模型的词嵌入层中,所述词嵌入层包括第一参数矩阵和第二参数矩阵,所述第一参数矩阵与第二参数矩阵的乘积作为所述词嵌入层的词向量字典,该方法包括:
接收输入文本数据,并在第一参数矩阵中获取与该输入数据对应的第一特征向量;
将该第一特征向量与第二参数矩阵进行矩阵乘法,生成第二特征向量;
将该第二特征向量作为所述输入文本数据对应的语义特征向量进行输出;
所述第一参数矩阵中的行数为词样本空间的样本数,第二参数矩阵中的列数为词样本的特征维度。
2.根据权利要求1所述的方法,其中,在第一参数矩阵中获取与该输入数据对应的第一特征向量包括:
根据所述输入数据执行查表处理,获取与所述输入数据对应的矩阵行地址,根据该矩阵行地址,获取所述第一参数矩阵中对应的行作为所述第一特征向量。
3.根据权利要求1所述的方法,还包括:
获取作为嵌入层的向量字典的初始参数矩阵,将该初始参数矩阵进行矩阵分解,生成所述第一参数矩阵和所述第二参数矩阵;
通过对深度学习模型的训练过程,更新所述第一参数矩阵和所述第二参数矩阵。
4.根据权利要求1所述的方法,还包括:
获取经过训练的嵌入层中的作为向量字典的参数矩阵,将初始参数矩阵进行矩阵分解,生成所述第一参数矩阵和所述第二参数矩阵。
5.一种数据处理装置,该装置设置于语义分析模型的词嵌入层中,其包括:
输入数据接收模块,用于接收输入文本数据;
参数矩阵存储模块,用于存储第一参数矩阵和第二参数矩阵,所述第一参数矩阵与第二参加参数的乘积作为所述词嵌入层的词向量字典;
特征向量获取模块,用于在第一参数矩阵中获取与该输入数据对应的第一特征向量,并将该第一特征向量与第二参数矩阵进行矩阵乘法,生成第二特征向量;
向量输出模块,用于将该第二特征向量作为所述文本输入数据对应的语义特征向量进行输出;
所述第一参数矩阵中的行数为词样本空间的样本数,第二参数矩阵中的列数为词样本的特征维度。
6.根据权利要求5所述的装置,其中,所述特征向量获取模块包括:
查表处理模块,用于根据所述输入数据执行查表处理,获取与所述输入数据对应的矩阵行地址,根据该矩阵行地址,获取所述第一参数矩阵中对应的行作为所述第一特征向量;
乘法处理模块,用于将该第一特征向量与第二参数矩阵进行矩阵乘法,生成第二特征向量。
7.一种电子设备,包括:
存储器,用于存储程序;
处理器,耦合至所述存储器,用于执行所述程序,该程序应用于针对语义分析模型的词嵌入层所进行的处理,该词嵌入层包括第一参数矩阵和第二参数矩阵,所述第一参数矩阵与第二参数矩阵的乘积作为所述词嵌入层的词向量字典,所述处理包括:
接收输入文本数据,在第一参数矩阵中获取与该输入数据对应的第一特征向量;
将该第一特征向量与第二参数矩阵进行矩阵乘法,生成第二特征向量;
将该第二特征向量作为所述输入文本数据对应的语义特征向量进行输出;
所述第一参数矩阵中的行数为词样本空间的样本数,第二参数矩阵中的列数为词样本的特征维度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811604698.2/1.html,转载请声明来源钻瓜专利网。





