首页在售求购查询申请展会资讯专利榜企服商城升级VIP

立即登录免费注册

在售专利
求购专利
查询专利
新闻资讯
技术展会
招商加盟
专利榜

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

[发明专利]通过元学习实现语法改错少样本领域适应的方法及系统有效

申请号：	202011183390.2	申请日：	2020-10-29
公开（公告）号：	CN112364990B	公开（公告）日：	2021-06-04
发明（设计）人：	杨麟儿;张生盛;黄雅平;杨尔弘;庞桂娜	申请（专利权）人：	北京语言大学
主分类号：	G06N3/08	分类号：	G06N3/08;G06K9/62;G06F30/27;G06F40/253
代理公司：	北京市广友专利事务所有限责任公司 11237	代理人：	张仲波;付忠林
地址：	100083***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	通过学习实现语法改错样本领域适应方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种通过元学习实现语法改错少样本领域适应的方法，其特征在于，所述通过元学习实现语法改错少样本领域适应的方法包括：

构建预训练数据集，所述预训练数据集中包括二语学习者所写的句子和母语修改者对二语学习者所写的句子的语法进行修改后的句子；

构建源领域数据集，所述源领域数据集中包括多个领域的语法改错数据；

构建目标领域数据集，所述目标领域数据集包括验证领域的数据和测试领域的数据；

先使用所述预训练数据集对预设的语法改错模型进行预训练；然后，使用所述源领域数据集对预训练后的语法改错模型进行元训练；

基于所述目标领域数据集，对元训练后的语法改错模型进行预设参数的调整，使得调整后的语法改错模型可以应用于对所述目标领域数据集中的数据进行语法改错的测试；

所述语法改错模型进行语法改错的过程，包括：

获取待改错的句子X＝{x₁,…,x_M}、相应的二语学习者的领域c，以及基于神经机器翻译的领域感知语法改错模型，对输出句子的条件概率Y＝{y₁,…,y_N}进行建模：其中，θ是模型参数；

首先将语法改错模型的参数适应到二语学习者领域c，然后以待改错的句子为条件对输出句子进行建模：其中，θ_c是适应到对应的二语学习者领域的模型参数的集合。

2.如权利要求1所述的通过元学习实现语法改错少样本领域适应的方法，其特征在于，所述语法改错模型以二语学习者所写的句子和母语修改者对二语学习者所写的句子的语法进行修改后的句子一一对应，形成句对作为输入。

3.如权利要求1所述的通过元学习实现语法改错少样本领域适应的方法，其特征在于，所述少样本领域为二语学习者语法改错数据量小于预设值的领域。

4.如权利要求1所述的通过元学习实现语法改错少样本领域适应的方法，其特征在于，所述预设的语法改错模型为基于梯度下降的语法改错模型。

5.如权利要求1所述的通过元学习实现语法改错少样本领域适应的方法，其特征在于，所述预训练为通过所述预训练数据集对预设的语法改错模型进行训练，以得到一套模型参数，利用得到的模型参数对模型进行初始化。

6.如权利要求1所述的通过元学习实现语法改错少样本领域适应的方法，其特征在于，所述学习者领域的定义标准为学习者的母语或熟练程度。

7.如权利要求1所述的通过元学习实现语法改错少样本领域适应的方法，其特征在于，使用源领域数据集对预训练后的语法改错模型进行元训练，包括：

定义一组源任务其中每个源任务是具有预设类型学习者领域的语法改错系统，而k是学习者的领域数；对于每个元学习事件，从τ中随机抽取任务然后，从的数据中独立抽取两个批次，分别是支持批次和查询批次首先使用更新语法改错模型参数：其中α是学习率，L是交叉熵损失函数，L的计算公式为：

在上评估更新后的参数并使用从该评估中计算出的梯度来更新原始模型参数θ，在更新θ前汇总多轮源任务，原始模型参数θ更新如下：其中，β为元学习率；

在元训练片段结束之后，从新的目标任务T_c的示例中完成预设类型任务的学习，以获得预设类型任务的模型参数θ_c。

8.如权利要求7所述的通过元学习实现语法改错少样本领域适应的方法，其特征在于，元参数的更新使用一阶近似值，以节省内存消耗。

9.一种通过元学习实现语法改错少样本领域适应的系统，其特征在于，所述通过元学习实现语法改错少样本领域适应的系统包括：

预训练数据集构建模块，用于构建预训练数据集，所述预训练数据集中包括二语学习者所写的句子和母语修改者对二语学习者所写的句子的语法进行修改后的句子；

源领域数据集构建模块，用于构建源领域数据集，所述源领域数据集中包括多个领域的语法改错数据；

目标领域数据集构建模块，用于构建目标领域数据集，所述目标领域数据集中包括验证领域的数据和测试领域的数据；

模型训练模块，用于先使用所述预训练数据集对预设的语法改错模型进行预训练；然后，使用所述源领域数据集对预训练后的语法改错模型进行元训练；

模型调整模块，用于基于所述目标领域数据集，对元训练后的语法改错模型进行预设参数的调整，使得调整后的语法改错模型可以应用于对所述目标领域数据集中的数据进行语法改错的测试；

所述语法改错模型进行语法改错的过程，包括：

获取待改错的句子X＝{x₁,…,x_M}、相应的二语学习者的领域c，以及基于神经机器翻译的领域感知语法改错模型，对输出句子的条件概率Y＝{y₁,…,y_N}进行建模：其中，θ是模型参数；

首先将语法改错模型的参数适应到二语学习者领域c，然后以待改错的句子为条件对输出句子进行建模：其中，θ_c是适应到对应的二语学习者领域的模型参数的集合。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京语言大学，未经北京语言大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202011183390.2/1.html，转载请声明来源钻瓜专利网。

上一篇：一种超级电容模块的焊接工艺
下一篇：基于LCMS高通量分析植物次生代谢产物的方法及应用

同类专利

专利分类

G06 计算；推算；计数
G06N 基于特定计算模型的计算机系统
G06N3-00 基于生物学模型的计算机系统
G06N3-02 .采用神经网络模型
G06N3-12 .采用遗传模型
G06N3-04 ..体系结构，例如，互连拓扑
G06N3-06 ..物理实现，即神经网络、神经元或神经元部分的硬件实现
G06N3-08 ..学习方法

免登录下载普通用户下载升级VIP会员，免费下载

友情链接：交换友情链接需要网站权重大于4，网站收录10W以上，如符合条件，请联系QQ：。

关于我们寻求报道投稿须知广告合作版权声明网站地图友情链接企业标识联系我们

在线咨询

周一至周五 9:00-18:00

版权所有http://www.vipzhuanli.com/公布日期

咨询在线客服

咨询在线客服

tel code back_top