[发明专利]自然语言处理方法及其设备和存储介质在审
| 申请号: | 201910160036.9 | 申请日: | 2019-03-01 |
| 公开(公告)号: | CN111368536A | 公开(公告)日: | 2020-07-03 |
| 发明(设计)人: | 庄毅萌;刘松;胡硕 | 申请(专利权)人: | 北京三星通信技术研究有限公司;三星电子株式会社 |
| 主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/30;G06N3/04 |
| 代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 唐文静 |
| 地址: | 100028 北京市朝*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 自然语言 处理 方法 及其 设备 存储 介质 | ||
1.一种基于自注意力的处理文本的方法,包括:
获取输入向量序列,所述输入向量序列包括待处理文本的词向量序列;
对输入向量序列中的词向量进行分组,并对至少一组词向量执行自注意力处理;以及
基于自注意力处理结果,生成待处理文本对应的输出向量序列。
2.根据权利要求1所述的方法,还包括:在所述对输入向量序列中的词向量进行分组之前,对输入向量序列中的各词向量进行排序。
3.根据权利要求2所述的方法,还包括:获取输入向量序列中的各词向量的排序权重,
其中,所述对输入向量序列中的各词向量进行排序,包括:根据各词向量的排序权重,对输入向量序列中的各词向量进行排序。
4.根据权利要求3所述的方法,其中,所述对输入向量序列中的各词向量进行排序,包括:
针对每个词向量,根据其排序权重,生成加权后的词向量;以及
根据各词向量对应的排序权重,对加权后的词向量进行排序。
5.根据权利要求1-4中任一项所述的方法,其中,
对输入向量序列中的词向量进行分组,并对至少一组词向量执行自注意力处理,包括:
对输入向量序列中的词向量进行分组,并对各组分别执行自注意力处理,
以及,基于自注意力处理结果,生成待处理文本对应的输出向量序列,包括:
基于各组的自注意力处理结果,生成待处理文本对应的输出向量序列。
6.根据权利要求5所述的方法,其中,对输入向量序列中的词向量进行分组,包括:
获取对输入向量序列中的词向量进行分组时的组的数量;
基于所述组的数量,对输入向量序列中的词向量进行分组。
7.根据权利要求5所述的方法,其中,所述基于各组的自注意力处理结果,生成待处理文本对应的输出向量序列,包括:
将各组的自注意力处理结果进行合并;以及
根据合并后的向量序列,生成待处理文本对应的输出向量序列。
8.根据权利要求1-4中任一项所述的方法,其中,对输入向量序列中的词向量进行分组,并对至少一组词向量执行自注意力处理,包括:
将输入向量序列中的词向量分为两组,对其中的一组词向量执行自注意力处理,而对另一组词向量不执行自注意力处理。
9.根据权利要求8所述的方法,其中,将输入向量序列中的词向量分为两组,包括:
通过排序,选取输入向量序列中的设定数目个词向量作为执行自注意力处理的一组。
10.根据权利要求8所述的方法,其中,基于自注意力处理结果,生成待处理文本对应的输出向量序列,包括:
对注意力处理结果进行补零,使得其向量数目与输入向量序列中的向量数目相同;以及
根据补零后的自注意力处理结果,生成待处理文本对应的输出向量序列。
11.根据权利要求8所述的方法,其中,对其中的一组词向量执行自注意力处理,包括:
将要执行自注意力处理的所述一组词向量进一步分组,并对各子分组分别执行自注意力处理,以及
合并各子分组的自注意力处理结果,以得到所述一组词向量的自注意力处理结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京三星通信技术研究有限公司;三星电子株式会社,未经北京三星通信技术研究有限公司;三星电子株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910160036.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:氮化镓高电子移动率晶体管及其栅极结构
- 下一篇:薄型泵





