[发明专利]命名实体识别方法、装置、终端设备及存储介质在审
申请号: | 202010087110.1 | 申请日: | 2020-02-11 |
公开(公告)号: | CN111339775A | 公开(公告)日: | 2020-06-26 |
发明(设计)人: | 陈桢博;金戈;徐亮 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295 |
代理公司: | 深圳中一联合知识产权代理有限公司 44414 | 代理人: | 张全文 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 命名 实体 识别 方法 装置 终端设备 存储 介质 | ||
本申请适用于计算机技术领域,提供了命名实体识别方法,包括:获取待识别文本,并将待识别文本转换为n×k维的第一矩阵;对第一矩阵进行多层卷积层卷积,其中对所述多层卷积层中卷积核的通道数为m的最后一层卷积层进行4次卷积操作,得到4个并行的n×m维的第二矩阵;对4个第二矩阵中的3个第二矩阵进行注意力权重自适应后得到n×m维的第三矩阵,将第三矩阵与剩余的1个第二矩阵进行矩阵加法,输出n×m维的第四矩阵;对第四矩阵进行分类,输出待识别文本对应的实体标注;根据实体标注,输出待识别文本对应的命名实体。通过在卷积层中引入注意力机制,有效降低数据冗余,减少模型参数量,加快命名实体识别模型的识别速度。
技术领域
本申请属于计算机技术领域,尤其涉及命名实体识别方法、装置、终端设备及存储介质。
背景技术
命名实体识别是从一段自然语言文本中识别出具有特点意义的实体的过程。目前,命名实体识别模型主要分为传统深度学习模型以及语言模型,传统深度学习模型主要以循环神经网络为主,该类模型的速度受限于其循环特性而导致识别速度慢。而语言模型是一种经过多任务训练的综合语言模型,但该类模型的参数量较大也导致识别速度慢。
本申请实施例提供了命名实体识别方法、装置、终端设备及存储介质,可以解决现有命名实体识别模型识别速度慢的问题。
第一方面,本申请实施例提供了一种命名实体识别方法,包括:
获取待识别文本,并将所述待识别文本转换为n×k维的第一矩阵,其中所述n为所述待识别文本的字符数,所述k为预设的所述待识别文本对应的字向量维度;
对所述第一矩阵进行多层卷积层卷积,其中对所述多层卷积层中卷积核的通道数为m的最后一层卷积层进行4次卷积操作,得到4个并行的n×m维的第二矩阵;
对4个所述第二矩阵中的3个所述第二矩阵进行注意力权重自适应后得到 n×m维的第三矩阵,将所述第三矩阵与剩余的1个所述第二矩阵进行矩阵加法,输出n×m维的第四矩阵;
对所述第四矩阵进行分类,输出所述第四矩阵对应的多个实体标注的概率,并根据多个所述概率确定所述待识别文本对应的实体标注;
根据所述待识别文本对应的实体标注,输出所述待识别文本对应的命名实体。
本申请实施例将待识别文本转换为第一矩阵后,在卷积层中对第一矩阵进行多层卷积得到4个并行的第二矩阵,并在卷积层中引入注意力机制,根据4 个第二矩阵得到特征集中的第四矩阵,从而通过采用注意力机制代替池化过程,使得待识别文本的特征集中,并且具备池化过程有效降低数据冗余,减少模型参数量的特点,加快命名实体识别模型的识别速度。
第二方面,本申请实施例提供了一种命名实体识别装置,包括:
获取模块,用于获取待识别文本,并将所述待识别文本转换为n×k维的第一矩阵,其中所述n为所述待识别文本的字符数,所述k为预设的所述待识别文本对应的字向量维度;
卷积模块,用于对所述第一矩阵进行多层卷积,其中对所述多层卷积层中卷积核的通道数为m的最后一层卷积层进行4次卷积操作,得到4个并行的n ×m维的第二矩阵;
注意力模块,用于对4个所述第二矩阵中的3个所述第二矩阵进行注意力权重自适应后得到n×m维的第三矩阵,将所述第三矩阵与剩余的1个所述第二矩阵进行矩阵加法,输出n×m维的第四矩阵;
分类模块,用于对所述第四矩阵进行分类,输出所述第四矩阵对应的多个实体标注的概率,并根据多个所述概率确定所述待识别文本对应的实体标注;
输出模块,用于根据所述待识别文本对应的实体标注,输出所述待识别文本对应的命名实体。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010087110.1/2.html,转载请声明来源钻瓜专利网。