[发明专利]自然语言处理方法及其设备和存储介质在审

专利信息
申请号: 201910160036.9 申请日: 2019-03-01
公开(公告)号: CN111368536A 公开(公告)日: 2020-07-03
发明(设计)人: 庄毅萌;刘松;胡硕 申请(专利权)人: 北京三星通信技术研究有限公司;三星电子株式会社
主分类号: G06F40/289 分类号: G06F40/289;G06F40/30;G06N3/04
代理公司: 中科专利商标代理有限责任公司 11021 代理人: 唐文静
地址: 100028 北京市朝*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 自然语言 处理 方法 及其 设备 存储 介质
【说明书】:

本公开提供了一种基于自注意力的自然语言处理方法及其设备和存储介质。所述方法,包括:获取输入向量序列,所述输入向量序列包括待处理文本的词向量序列;对输入向量序列中的词向量进行分组,并对至少一组词向量执行自注意力处理;以及,基于自注意力处理结果,生成待处理文本对应的输出向量序列。

技术领域

本公开一般地涉及自然语言处理领域,具体地涉及基于自注意力 的自然语言处理方法以及对应的设备和计算机可读存储介质。

背景技术

自注意力(Self Attention)机制是一种用于对长时间依赖进行建 模的方法。所谓长时间依赖指的是自然语言文本中相距较远的文本信 息之间存在的依赖关系。比如文章中某处出现“海明威出生在奥克帕 克”,文章中另一处出现“海明威是1954年诺贝尔文学奖获得者”,对 于人类而言,即使这两点信息出现在文章中相距很远的两个位置,人 类仍然可以由此得出1954年诺贝尔文学奖获得者出生在奥克帕克的 结论,但是对于计算机,传统的机器阅读理解方法难以处理这种长距 离(时间)跨度的问题,计算机难以将跨度较大的两个“海明威”联系 起来并建立“奥克帕克”与“诺贝尔文学奖”的关联。自注意力机制就是 解决这种问题的有效方法,自注意力机制通过计算相似度矩阵来计算 文章中任意两个词语之间的关联度,可以建立相距较远的信息之间的 联系。

在现有自注意力机制中,计算相似度矩阵S的公式可以一般性地 表示如下:

S=f(X)·f(XT) (1)

其中X是待处理文本的矩阵表示,X的每一列对应于文本中的一个 词向量,词向量在X中的列位置与其在文本中的位置相对应。S表征了 文本中的词与词之间的关联度,S中的元素sij表示文本中的第i个词 与第j个词之间的关联度。X是L*d维矩阵,L为文本长度,d为词向 量维度,f是线性或非线性映射函数(本领域技术人员应该理解,函 数f的具体选择因方法而异,这里给出的是自注意力的一般性公式)。 因此S的计算的时间和空间复杂度(对应于自注意力机制的计算的时 间和空间复杂度)为O(L2d),即算法复杂度与文本长度L成平方关系。 当L非常大时,计算的时间和空间复杂度将高到无法接受。

因此,需要一种改进的基于自注意力的自然语言处理机制,其能 够降低计算和空间复杂度,适合处理超长文本。

发明内容

为此,本公开提出了一种基于分组的自注意力机制,其中通过对 长文本中的词语进行分组(优选地,按重要度进行排序分组)的方式 来降低自注意力机制的计算的时间和空间复杂度。根据本公开的基于 分组的自注意力机制例如可以将计算的时间和空间复杂度降低到接 近线性复杂度,例如文本长度增加10倍,自注意力机制计算的时间 和空间复杂度仅增加10倍。本公开的基于分组的自注意力机制可以 适用于超长文本。

根据本公开的第一方面,提供了一种基于自注意力的处理文本的 方法,包括:获取输入向量序列,所述输入向量序列包括待处理文本 的词向量序列;对输入向量序列中的词向量进行分组,并对至少一组 词向量执行自注意力处理;以及基于自注意力处理结果,生成待处理 文本对应的输出向量序列。

根据本公开的第二方面,提供了一种机器阅读理解方法,包括: 获取问题和文章;针对文章的文本,执行分组自注意力处理,以得到 文章文本的自注意力处理后的词向量序列;根据文章文本的自注意力 处理后的词向量序列,获得文章中每个词语关于所述问题的对齐向量; 以及根据对齐向量,生成针对问题的答案。其中,所述分组自注意力 处理包括;获取输入向量序列;对输入向量序列中的词向量进行分组, 并对至少一组词向量执行自注意力处理;以及,基于自注意力处理结 果,生成待处理文本的自注意力处理后的词向量序列。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京三星通信技术研究有限公司;三星电子株式会社,未经北京三星通信技术研究有限公司;三星电子株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910160036.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top