首页在售求购查询申请展会资讯专利榜企服商城升级VIP

立即登录免费注册

在售专利
求购专利
查询专利
新闻资讯
技术展会
招商加盟
专利榜

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

[发明专利]大规模语言模型去偏倚方法、系统、设备及存储介质在审

申请号：	202210184515.6	申请日：	2022-02-25
公开（公告）号：	CN114462395A	公开（公告）日：	2022-05-10
发明（设计）人：	刘奕然;刘潇;于洋	申请（专利权）人：	交叉信息核心技术研究院（西安）有限公司
主分类号：	G06F40/237	分类号：	G06F40/237;G06F40/20;G06N3/08;G06N3/04
代理公司：	北京中巡通大知识产权代理有限公司 11703	代理人：	张弘
地址：	710077 陕西省西安市高新***	国省代码：	陕西;61
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	大规模语言模型偏倚方法系统设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种大规模语言模型去偏倚方法，其特征在于，包括：

获取基于神经网络的大规模预训练语言模型；

针对所述大规模预训练语言模型采用数据自生成方法获得用于性别偏倚分析的文本数据，形成语料库，基于所述语料库建立一系列模板；

利用所述模板计算所述大规模预训练语言模型的性别偏倚水平，根据性别偏倚水平反向传播计算大规模预训练语言模型的纠偏梯度；

根据纠偏梯度更新大规模预训练语言模型中的模型参数，重复寻优更新直至满足预设更新完成条件，得到去性别偏倚的大规模语言模型。

2.根据权利要求1所述的大规模语言模型去偏倚方法，其特征在于，

所述大规模预训练语言模型为GPT-2模型，其中自然语言语料库表现为符号序列[s₁,s₂,...,s_n+1]的形式；大规模预训练语言模型被建模为计算条件概率的任务：

p(s_n+1|s₁,s₂,...,s_n). (1)

大规模预训练语言模型包含两个部分，第一部分令牌嵌入ε将符号序列转换为嵌入向量序列以用于神经网络的计算，即

特别地，对于静态的令牌嵌入ε有：

ε([s₁，s₂，…，s_n])＝[ε(s₁)，ε(s₂)，…，ε(s_n)]

另一部分是用于计算条件概率(1)的神经网络结构M为：

3.根据权利要求1所述的大规模语言模型去偏倚方法，其特征在于，

所述针对所述大规模预训练语言模型采用数据自生成方法获得用于性别偏倚分析的文本数据，具体包括：

对于用于偏差计算的数据，满足两个要求：

1)语境应当把职业和性别两个概念联系起来，要求文本数据包含目标职业词语并满足：

对于某种阈值s；

2)文本数据不应包含提示性别的信息，要求文本数据由中性字组成。

4.根据权利要求3所述的大规模语言模型去偏倚方法，其特征在于，

所述针对所述大规模预训练语言模型采用数据自生成方法获得用于性别偏倚分析的文本数据，形成语料库，基于所述语料库建立一系列模板，具体包括：

对于选定的职业，确定句子的开头；

通过GPT－2模型的预测结果在生成数据中逐一添加单词随机以生成句子；

在这个过程中，把中性作为单词选择的标准，把中间作为算法结束的标准；在判断单词是否与性别相关的过程中，使用由贡献的单词列表；

若满足两个要求均满足则将满足要求的句子作为语料库，基于所述语料库建立一系列模板，并保存。

5.根据权利要求1所述的大规模语言模型去偏倚方法，其特征在于，

所述利用所述模板计算所述大规模预训练语言模型的性别偏倚水平，具体是使用性别信息的增益来测量给定语境的模型的性别偏倚，其表示为：

其中H(.)是香农熵的函数；

使用代词选择来计算模型的性别预测，即：

将对包含某职业的所有文本数据的性别偏倚的预期视为模型对某职业的性别偏倚，即：

并且定义模型在职业维度上的性别偏倚，用表示，是所有职业的偏倚的平均值。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于交叉信息核心技术研究院（西安）有限公司，未经交叉信息核心技术研究院（西安）有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202210184515.6/1.html，转载请声明来源钻瓜专利网。

上一篇：一种预制箱涵件自动精调拼装控制方法
下一篇：一种用于无人机的无线信号中继切换方法及其系统

同类专利

专利分类

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

友情链接：交换友情链接需要网站权重大于4，网站收录10W以上，如符合条件，请联系QQ：。

关于我们寻求报道投稿须知广告合作版权声明网站地图友情链接企业标识联系我们

在线咨询

周一至周五 9:00-18:00

版权所有http://www.vipzhuanli.com/公布日期

咨询在线客服

咨询在线客服

tel code back_top