[发明专利]基于增量学习的词向量生成方法和装置有效

申请号：	201710022618.1	申请日：	2017-01-12
公开（公告）号：	CN106844342B	公开（公告）日：	2019-10-08
发明（设计）人：	张日崇;包梦蛟;刘垚鹏;彭浩;李建欣	申请（专利权）人：	北京航空航天大学
主分类号：	G06F17/27	分类号：	G06F17/27
代理公司：	北京同立钧成知识产权代理有限公司 11205	代理人：	宋扬;刘芳
地址：	100191 北京市海***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于增量学习向量生成方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于增量学习的词向量生成方法，其特征在于，包括：

获取原始语料库的词共现矩阵、新增语料库的词共现矩阵和所述原始语料库的训练结果参数，所述训练结果参数包括梯度值和第一矩阵分解结果；

将所述原始语料库的训练结果参数作为所述新增语料库的初始训练参数；

使用所述新增语料库的初始训练参数、所述原始语料库的词共现矩阵和所述新增语料库的词共现矩阵采用梯度下降算法迭代优化总目标函数，获取第二矩阵分解结果，所述第二矩阵分解结果为使得所述总目标函数极小化的解；

根据所述第二矩阵分解结果获取多个词向量。

2.根据权利要求1所述的方法，其特征在于，所述使用所述新增语料库的初始训练参数、所述原始语料库的词共现矩阵和所述新增语料库的词共现矩阵采用梯度下降算法迭代优化总目标函数，包括：

i分别取1至V，j分别取1至V，若X_ij不等于0，则根据X_ij、ΔX_ij和增量梯度函数确定W_i′^T和对应的梯度方向，使用所述新增语料库的初始训练参数、X_ij和ΔX_ij沿所述梯度方向更新W_i′^T和直至根据2V个词向量确定的总目标函数的值极小，将所述2V个词向量作为所述第二矩阵分解结果中的词向量，其中，所述增量梯度函数是对增量目标函数求导，所述增量目标函数具体为：其中，W_i′^T和是所述第二矩阵分解结果中的词向量，b_i和是偏移向量，X_ij是原始语料库的词共现矩阵中索引为i的词和索引为j的词的共现值，ΔX_ij是所述新增语料库的词共现矩阵中索引为i的词和索引为j的词的共现值，f₀是权重函数，为权重变化函数。

3.根据权利要求2所述的方法，其特征在于，所述使用所述新增语料库的初始训练参数、X_ij和ΔX_ij沿所述梯度方向更新W_i′^T和包括：

设置迭代次数t；

当t＝1时，采用下式更新W_i′^T、b_i′和

当t>1时，采用下式更新W_i′^T、b_i′和

其中，W_i^T和是所述第一矩阵分解结果中的词向量，b_i′和是偏移向量，η′为梯度下降算法的学习率。

4.根据权利要求2所述的方法，其特征在于，所述方法还包括：

若存在X_ij等于0，则根据X_ij、ΔX_ij和总梯度函数确定W_i′^T和对应的梯度方向，使用所述新增语料库的初始训练参数、X_ij和ΔX_ij沿所述梯度方向更新W_i′^T和其中，所述总梯度函数是对总目标函数求导，所述总目标函数具体为：其中，f₁(X_ij+ΔX_ij)是变化后的语料库的权重函数。

5.根据权利要求1所述的方法，其特征在于，所述方法还包括：

根据预先设定的滑动窗口统计所述新增语料库中相应数量的单词的共现次数；

根据所述共现次数建立所述新增语料库的词共现矩阵。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京航空航天大学，未经北京航空航天大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201710022618.1/1.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F17-00 特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法
G06F17-10 .复杂数学运算的
G06F17-20 .处理自然语言数据的
G06F17-30 .信息检索；及其数据库结构
G06F17-40 .数据的获取和记录
G06F17-50 .计算机辅助设计

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于增量学习的词向量生成方法和装置有效

专利文献下载