[发明专利]基于图卷积神经网络的中文旅游领域命名实体识别方法在审

专利信息
申请号: 202010087875.5 申请日: 2020-02-12
公开(公告)号: CN111259672A 公开(公告)日: 2020-06-09
发明(设计)人: 西尔艾力·色提;吾买尔江·买买提明;吐尔根·依布拉音;艾山·吾买尔;买合木提·买买提;娜迪热·艾来提;阿拉提·阿扎提 申请(专利权)人: 新疆大学
主分类号: G06F40/295 分类号: G06F40/295;G06N3/04;G06N3/08
代理公司: 北京中政联科专利代理事务所(普通合伙) 11489 代理人: 黄娟
地址: 830046 新疆维*** 国省代码: 新疆;65
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 图卷 神经网络 中文 旅游 领域 命名 实体 识别 方法
【说明书】:

基于图卷积神经网络的中文旅游领域命名实体识别方法,图卷积神经网络包括输入层、嵌入层、图卷积层和层级结构,其中输入体包括命名实体和非实体;S1:以旅游领域文本的任意非实体为中心同时向两边扩展,直至遍历完整个句子中的单个字;S2:字符特征的提取;S3:提取字符特征;S4:输入和训练;S5:图卷积层优化;S6:旅游领域文本数据中全部的命名实体进行标注;在图卷积层中引入拉普拉斯正则化损失函数,以进行节点内部结构信息的挖掘和字符特征的提取;S7:获得命名实体和非实体之间的层级关系。本发明,利用图卷积神经网络构建字符特征提取方法,并对字符特征进行语义建模,以实现文本中命名实体的正确识别。

技术领域

本发明涉及文旅游领域命名实体识别方法领域,尤其涉及基于图卷积神经网络的中文旅游领域命名实体识别方法。

背景技术

命名实体识别是指从大量的非结构化或结构化文本中抽取出相应的人名、地名或组织机构等实体,并对其进行精确的分类识别。而传统的命名实体识别方法,严重依赖于语言学知识和特征工程,使其忽略了文本中实体所隐含的潜在信息,从而增加了文本中命名实体的识别难度。

自然语言处理形态分析领域,随着人类生活水平的提高,出行旅游是我们的生活中并不缺少的一部分。人们对旅游领域的关注度越来越重视。目前为止。每天在互联网上出现海量的旅游信息,从海量的信息中抽取人们感兴趣内容是及时解决的问题之一。而且旅游领域命名实体识别是旅游信息抽取的重要的部分,所以本文中研究旅游领域命名实体识别。

随着深度学习技术的不断成熟,大量的深度学习技术被应用到了命名实体抽取和识别中,并通过多层的神经网络结构以捕获文本中命名实体所隐含的潜在信息。如谷川等人利用双层条件随机场来获取底层条件随机场来识别出简单的实体,高层条件随机场嵌套使用识别复杂命名实体,并提高了识别的精度。

如冯艳红等人利用词向量特征和双向的长短期记忆网络(Bidirectional LongShort-Term Memory,Bi-LSTM)来获取文本序列标签的相关性,以及命名实体的上下文语义信息,并提高了命名实体的识别精度。

Maryam Habibi等人利用词嵌入技术提取了生物医学文本中命名实体的词向量特征,并用该特征替换了手工特征,最后,借助深度学习技术对其进行了识别分类。Pham,Thai-Hoang等人为提高越南语文本中命名实体的识别准确度,在双向长短期记忆网络的基础上,引入了条件随机场(Conditional Random Field,CRF)和卷积神经网络(Convolutional Neural Network,CNN),并使用词和句子向量特征作为输入来增加越语文本中命名实体的判别性。

Augenstein,Isabelle等人结合特征稀疏表示和深度学习技术对Web文本中的用户命名实体进行了抽取和识别,并对该方法的可行性进行了解释。

以上研究学者使用深度学习算法虽然解决了人工参与设定特征带来的误差,并提高了命名实体识别的准确率,但大多是基于某种单一词嵌入技术来提取文本的词向量特征,而该方法不仅会丢失文本中命名实体的语义信息,同时也会忽略文本中命名实体之间的层级信息。

因此,针对上述问题,本文结合自注意力机制提出字符图卷积神经网络的命名实体识别方法,即通过字符图卷积神经网络来提取文本中命名实体的字符特征和实体的内部结构信息。

发明内容

(一)发明目的

为解决背景技术中存在的技术问题,本发明提出基于图卷积神经网络的中文旅游领域命名实体识别方法,对字符特征进行语义建模,以实现文本中命名实体的正确识别。

(二)技术方案

为解决上述问题,本发明提出了基于图卷积神经网络的中文旅游领域命名实体识别方法,图卷积神经网络包括输入层、嵌入层、图卷积层和层级结构,其中输入体包括命名实体和非实体;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新疆大学,未经新疆大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010087875.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top