[发明专利]预训练模型中注意力矩阵的更新方法、装置及电子设备在审
| 申请号: | 202211665709.4 | 申请日: | 2022-12-23 |
| 公开(公告)号: | CN116383637A | 公开(公告)日: | 2023-07-04 |
| 发明(设计)人: | 柴业坤;王硕寰;孙宇 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
| 主分类号: | G06F18/214 | 分类号: | G06F18/214;G06N3/04;G06N3/08 |
| 代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 张大威 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本公开公开了一种预训练模型中注意力矩阵的更新方法、装置及电子设备,涉及计算机技术领域,具体涉及自然语言处理、深度学习等人工智能技术领域。包括:生成待掩码的第一注意力矩阵对应的第一掩码矩阵及第二掩码矩阵;将当前任务对应的样本数据分别输入第一掩码矩阵对应的第一模型及第二掩码矩阵对应的第二模型,以获取第一奖励值及第二奖励值;进而生成第三掩码矩阵;基于第三掩码矩阵,返回执行获取掩码后的模型的操作,直至获取第一注意力矩阵在样本数据下的目标掩码矩阵。由此,通过前向推断,可以较为快速的确定出目标掩码矩阵,涉及的数据量较少,从而节省了计算资源,同时也节省了确定目标掩码矩阵的时间,提高了效率。 | ||
| 搜索关键词: | 训练 模型 注意力 矩阵 更新 方法 装置 电子设备 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202211665709.4/,转载请声明来源钻瓜专利网。
- 上一篇:具有多个机电蓄电池接口的电器具
- 下一篇:用于电动马达的清漆涂敷器





