[发明专利]验证预训练语言模型中群体外显和内隐态度的分析装置在审

申请号：	202310482308.3	申请日：	2023-04-30
公开（公告）号：	CN116629249A	公开（公告）日：	2023-08-22
发明（设计）人：	王博;任庆恩	申请（专利权）人：	天津大学
主分类号：	G06F40/284	分类号：	G06F40/284;G06F40/211;G06F40/289;G06F16/35;G06N3/045;G06F18/22
代理公司：	天津市北洋有限责任专利代理事务所 12201	代理人：	刘子文
地址：	300072***	国省代码：	天津;12
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	验证训练语言模型群体态度分析装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种验证预训练语言模型中群体外显和内隐态度的分析装置，其特征在于，包括数据处理模块、模型训练模块以及外显和内隐态度分析模块；

所述数据处理模块用于解析提取社会群体中用户发表的言论数据，根据内隐联想测试中提到的概念词和属性词来对中英文维基百科、twitter和微博中用户的言论处理分析；将文本语料分割成社会群体对目标概念的外显和内隐态度；首先遮蔽掉文本语料中既包含概念词和属性词的句子中的目标词汇得到群体内隐言论集合A，再遮蔽掉文本语料中单独包含概念词或属性词的句子中的目标词汇得到群体外显言论集合B；

模型训练模块，用于构建学习社会群体外显和内隐态度的预训练语言模型；并利用群体内隐言论集合A和群体外显言论集合B分别训练包含社会群体外显和内隐态度的预训练语言模型；

外显和内隐态度分析模块，利用NLP领域现有的偏见测量方法，分别根据词嵌入之间、句嵌入之间在向量空间中的距离远近和上下文中目标词汇之间的条件概率来测量对应目标词和属性词之间的关联，从而量化预训练语言模型中社会群体的外显和内隐态度。

2.一种验证预训练语言模型中群体外显和内隐态度的分析方法，其特征在于，包括：

(1)根据内隐联想测试中提到的概念词和属性词来对中英文维基百科、twitter和微博中用户的言论处理分析；将文本语料分割成社会群体对目标概念的外显和内隐态度；

首先遮蔽掉文本语料中既包含概念词和属性词的句子中的目标词汇得到群体内隐言论集合A，再遮蔽掉文本语料中单独包含概念词或属性词的句子中的目标词汇得到群体外显言论集合B；

(2)利用群体内隐言论集合A和群体外显言论集合B分别训练包含社会群体外显和内隐态度的预训练语言模型；

(3)利用NLP领域现有的偏见测量方法，分别根据词嵌入之间、句嵌入之间在向量空间中的距离远近和上下文中目标词汇之间的条件概率来测量对应目标词和属性词之间的关联，从而量化预训练语言模型中社会群体的外显和内隐态度。

3.一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现权利要求2所述验证预训练语言模型中群体外显和内隐态度分析方法的步骤。

4.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该计算机程序被处理器执行时实现权利要求2所述验证预训练语言模型中群体外显和内隐态度分析方法的步骤。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于天津大学，未经天津大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202310482308.3/1.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]验证预训练语言模型中群体外显和内隐态度的分析装置在审

专利文献下载