[发明专利]一种多任务模型生成词向量的方法有效
申请号: | 201811117839.8 | 申请日: | 2018-09-21 |
公开(公告)号: | CN109325231B | 公开(公告)日: | 2023-07-04 |
发明(设计)人: | 黄定帮;潘嵘 | 申请(专利权)人: | 中山大学 |
主分类号: | G06F40/284 | 分类号: | G06F40/284;G06F40/268;G06F16/35;G06F18/2415;G06F18/2431;G06F18/27;G06N3/084;G06N3/088;G06N3/0985 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 陈伟斌 |
地址: | 510275 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 任务 模型 生成 向量 方法 | ||
1.一种多任务模型生成词向量的方法,其特征在于,包括以下步骤:
S1.数据预处理与词向量初始化;所述的步骤S1中:
将每个词与某个向量关联起来,即需要实现这一个转换函数,将一个词映射到一个n维的向量中:
在此之后的模型训练优化时,更新对应的向量的值即为对该词向量进行更新;具体实现方法是先以正态分布的方法先随机初始化一个V×n维的矩阵其中V表示语料的词汇量;然后通过词典的方法对每个词进行编号,从而每个词w(i)都对应一个编号i,以矩阵E的第i行的向量Ei作为词w(i)的词向量:
所以在模型中,矩阵E便可认为是由所有的词向量拼接组成的矩阵,对矩阵E的第i行进行更新也就对应于对词w(i)的词向量进行更新;而模型收敛时,矩阵E也做作为模型的词向量结果;
在w(i)中使用的上标i表示其在字典中的编号顺序;同理,当使用(v(i),y(i))时,其分别表示数据集中第i个样本的词向量矩阵v(i),及其标注y(i),而则表示第i个样本中第j个词对应的词向量,则表示第i个样本中第j个词对应的标注信息,的表示只在词性标注需要使用;
S2.分类任务;其中,选择以Fasttext模型作为分类算法;
S3.词性任务,其中,使用多分类的逻辑回归算法作为词性任务的模型算法;
S4.无监督任务;其中,在无监督任务中使用GloVe模型进行描述;
S5.优化目标与参数优化。
2.根据权利要求1所述的一种多任务模型生成词向量的方法,其特征在于:所述的步骤S2中,
对于输入的文本其对应的词向量矩阵为其中T表示文本序列的长度,记y(i)为该文本的类别,N为训练语料中的样本数,则模型的任务目标为:
在表述时采用softmax,此时在式(3)中:
其中
最后采用交叉熵作为分类任务的损失函数,其损失函数可表示为:
3.根据权利要求1所述的一种多任务模型生成词向量的方法,其特征在于:所述的步骤S3中,
对于输入的文本其对应的词向量矩阵为其中T表示文本序列的长度,记y(i)为该文本的类别,N为训练语料中的样本数,因多分类的逻辑回归算法是softmax函数的一种应用,采用与分类任务计算损失函数相同的方法可得词性任务中的损失函数为:
4.根据权利要求1所述的一种多任务模型生成词向量的方法,其特征在于:所述的步骤S4中,
构建统计共现矩阵:
使用矩阵记录语料的共现信息,其中V为词汇表大小,其元素Xij则表示词w(i)与词w(j)的共现次数,其中i和j均为词的序号,与词的预处理中映射的序号相同;在统计共现信息是,先将矩阵X初始化为0,然后滑动窗口,对于每个窗口,若词w(i)与词w(j)在滑动窗口中,则Xij=Xij+1,滑动窗口到语料结束,则统计结束;
构建损失函数:
GloVe模型的损失函数数学表达式为:
其中bi,bj为待学习的标量参数,f(x)为值域为[0,1]的函数:
其中xM为预先设置的阈值,用于归一化操作。
5.根据权利要求1所述的一种多任务模型生成词向量的方法,其特征在于:所述的步骤S5中,
优化目标为最小化如下的联合损失函数:
L=αLc+βLp+γLl (10)
其中α、β、γ为待调节且大于0的超参,Lc、Lp、Ll分别对应于式(6)、式(7)、式(8)中的损失函数;
在最优化参数时采用基于反向传播算法的批量随机梯度下降法;在损失函数L达到一定阈值或者随着训练继续而不再下降时,模型收敛,训练结束;同时因为Lp的损失函数更容易收敛,在初始训练时,先将β设为一个接近0的值,在Lc、Ll快要收敛时,再将β值增大。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811117839.8/1.html,转载请声明来源钻瓜专利网。