[发明专利]一种基于循环神经网络的中文人名识别方法有效
申请号: | 201610308475.6 | 申请日: | 2016-05-10 |
公开(公告)号: | CN105868184B | 公开(公告)日: | 2018-06-08 |
发明(设计)人: | 黄德根;徐新峰 | 申请(专利权)人: | 大连理工大学 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06N3/02 |
代理公司: | 大连理工大学专利中心 21200 | 代理人: | 温福雪;李宝元 |
地址: | 116024 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种基于循环神经网络的中文人名识别方法,本发明包括:S1、语料预处理;S2、词向量训练,利用word2vec工具进行词向量训练;S3、中文人名识别模型训练,利用S1处理后得到的数据以及S2训练得到的词向量对神经网络模型进行训练。S4、人名识别以及后处理,利用S3训练得到的模型在测试语料上进行人名识别,并利用上下文规则,扩散算法对模型识别出来的人名进行后处理,最后得到人名。利用本发明能有效的降低在中文人名识别时特征选取的复杂性,通过词向量充分利用中文文本中蕴含的丰富的句法和语法信息,从而增加模型的泛化能力,并且同时识别了日本人名和外国音译人名,扩大了中文人名识别的广度。 | ||
搜索关键词: | 人名识别 词向量 中文 循环神经网络 后处理 神经网络模型 上下文规则 语料预处理 测试语料 模型识别 模型训练 特征选取 语法信息 中文文本 句法 算法 扩散 | ||
【主权项】:
一种基于循环神经网络的中文人名识别方法,其特征在于,步骤如下:步骤1:对训练语料进行预处理:步骤(a):利用中文分词工具对训练语料进行分词,并建立词词典;在词词典中为每一个词分配序号,序号从1号开始编号,0号保留用来表示没有出现在词词典中的词;步骤(b):先利用步骤(a)中的词词典对分词后的训练语料进行数字化处理,将结果保存到数字化文本中;再为每一个词分配分类标签,将结果保存到分类标签文本中;步骤2:词向量训练:先利用中文分词工具对大规模中文文本进行分词,再使用word2vec对分词后的大规模中文文本进行训练得到词向量文件,并根据步骤1中得到的词词典对词向量文件进行筛选,仅保留词词典中存在词的词向量,并存入词向量矩阵文本中;步骤3:中文人名识别模型训练:将步骤1生成的数字化文本、分类标签文本以及步骤2生成的词向量矩阵文本作为循环神经网络模型的输入,进行中文人名识别模型的训练;步骤a):根据循环神经网络模型的窗口参数win的大小,将当前词t的前win/2和后win/2个词所对应的词向量进行首尾相接,组合成新的词向量表示当前词,记为w(t);步骤b):将待处理的句子按照mini‑batch原则进行分块;步骤c):使用循环神经网络模型对步骤b)中的每一个块进行训练;将步骤a)中得到的词向量w(t)和前一步隐藏层的输出作为当前层的输入,通过激活函数变换得到隐藏层,如公式所示:s(t)=f(w(t)u+s(t‑1)w)式中,f为神经单元节点的激活函数,w(t)表示当前词t的词向量,s(t‑1)表示前一步隐藏层的输出,w和u分别表示前一步隐藏层与当前隐藏层的权重矩阵和输入层与当前隐藏层的权重矩阵,s(t)表示当前步隐藏层的输出;再利用隐藏层输出得到输出层的值,如公式所示:y(t)=g(s(t)v)式中,g为softmax激活函数,v表示当前隐藏层与输出层的权重矩阵,y(t)为当前词t的预测值;步骤d):对步骤c)中获得的预测值y(t)与真实值进行比较,若两者的差值高于某一设定阈值时,通过逆向反馈神经网络对各层之间的权重矩阵进行调整;步骤e):循环神经网络模型中学习率自调整,在训练过程中,循环神经网络模型经过每次迭代后,对开发集进行结果测试,如果在设定的迭代次数内都未在开发集上获得更好的效果,则对学习率进行减半,进行下一次迭代操作;至学习率低于所设阈值停止训练,循环神经网络模型达到收敛状态;步骤4:人名识别及后处理:步骤a:使用中文分词工具对测试语料进行分词,并使用步骤1中得到的词词典对分词后的测试语料进行数字化操作,得到数字化文本;步骤b:利用步骤3训练得到中文人名识别模型,对步骤a得到的数字化文本进行测试,并将识别的中文人名作为候选人名;步骤c:使用上下文规则筛选候选人名,过滤不符合规则的人名;步骤d:使用基于篇章的全局扩散算法召回已经识别出而在上下文信息不足或者上下文信息过拟合的位置中未被识别的人名;步骤e:使用基于篇章的局部扩散算法召回有名无姓、有姓无名的人名,将经过筛选后的人名定为最终人名。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610308475.6/,转载请声明来源钻瓜专利网。
- 上一篇:一种一泵多用的节段式多级泵
- 下一篇:一种真空泵的端盖密封