[发明专利]一种基于提示学习的领域自适应方法在审
申请号: | 202210555187.6 | 申请日: | 2022-05-19 |
公开(公告)号: | CN114817550A | 公开(公告)日: | 2022-07-29 |
发明(设计)人: | 李云;沈辉;朱毅;强继朋;袁运浩 | 申请(专利权)人: | 扬州大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/30;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 南京苏科专利代理有限责任公司 32102 | 代理人: | 董旭东;季雯 |
地址: | 225009 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 提示 学习 领域 自适应 方法 | ||
1.一种基于提示学习的领域自适应方法,其特征在于,包括以下步骤:
1)选择Bert模型,将该预训练语言模型作为主干,对提示学习方法中的模板和标签词进行设置;
2)构造出所需要的提示学习模型,对于数据集,运用提示学习数据加载函数对数据进行加载和处理,之后进行领域自适应任务;
3)随机选取少量源域数据样本进行训练,之后将目标域的句子嵌入到同样的模板中,通过预训练语言模型进行掩码语言建模,对输入的目标域句子进行分类预测。
2.根据权利要求1所述的一种基于提示学习的领域自适应方法,其特征在于,所述步骤1)具体包括:
步骤1.1)选择预训练语言模型Bert作为主干;
步骤1.2)模板设置,模板为修改原有的输入,根据不同数据集的内容来手动设置不同的模板,将原始输入进行修改和封装,对于每个实例x,首先使用模板将x映射到提示输入xprompt=T(x);
步骤1.3)标签词的设置:将原始标签投影到一组标签词中,存在一个单射映射函数Y→V,它连接了类集和标签词集,根据原始标签,映射一组跟其意思接近的标签词。
3.根据权利要求1所述的一种基于提示学习的领域自适应方法,其特征在于,所述步骤2)具体包括:
步骤2.1)构造提示学习模型,调用openprompt第三方库中的提示学习分类函数,所述提示学习分类函数包括三个参数,分别是预训练语言模型、模板、标签词,将步骤1)中得到三个变量分别赋予进去,从而可以得到提示模型;
步骤2.2)加载和处理源域和目标域中的数据集,调用openprompt第三方库中的提示数据加载函数,所述提示数据加载函数包括四个参数,分别是数据集、分词器、模板、分词包装类,所述分词器和分词包装类所要赋予的值是由调用加载预训练语言模型函数得到的,之后得到处理好的的训练和测试数据集,从而进行领域自适应任务。
4.根据权利要求1所述的一种基于提示学习的领域自适应方法,其特征在于,所述步骤3)体包括:
步骤3.1)在对少量源域数据进行训练后,当目标域句子嵌入到模板中,它将被归类带标签为y的类别中,其中y∈Y,标签词集为Vy={v1,v2,…,vn},Vy是整个词汇V的子集,即Vy∈V,并且Vy被映射到标签为y的类别中;在预训练语言模型中,Vy中的每个单词被填入到[MASK]中,其概率表示为P([MASK]=v∈Vy|Xp);因此,对目标域分类任务转化为标签词的概率计算问题,其计算公式如(1)所示:
P(y∈Y|Xp)=P([MASK]=v∈Vy|Xp) (1)
步骤3.2)在求出Vy中每个标签词的概率后,将目标域中每个标签词得到的预测概率映射到具体地类别标签上,预测分数的平均值作为最后类别分类的依据,则预测标签如(2)所示:
步骤3.3)在目标域句子中,如果的V1={computer}的计算预测概率大于的V2={recreation},则最后预测该目标域中的句子被分类为Computer类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于扬州大学,未经扬州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210555187.6/1.html,转载请声明来源钻瓜专利网。