[发明专利]命名实体识别方法、装置、终端设备及存储介质在审
申请号: | 202010087110.1 | 申请日: | 2020-02-11 |
公开(公告)号: | CN111339775A | 公开(公告)日: | 2020-06-26 |
发明(设计)人: | 陈桢博;金戈;徐亮 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295 |
代理公司: | 深圳中一联合知识产权代理有限公司 44414 | 代理人: | 张全文 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 命名 实体 识别 方法 装置 终端设备 存储 介质 | ||
1.一种命名实体识别方法,其特征在于,所述方法包括:
获取待识别文本,并将所述待识别文本转换为n×k维的第一矩阵,其中所述n为所述待识别文本的字符数,所述k为预设的所述待识别文本对应的字向量维度;
对所述第一矩阵进行多层卷积层卷积,其中对所述多层卷积层中卷积核的通道数为m的最后一层卷积层进行4次卷积操作,得到4个并行的n×m维的第二矩阵;
对4个所述第二矩阵中的3个所述第二矩阵进行注意力权重自适应后,得到n×m维的第三矩阵,将所述第三矩阵与剩余的1个所述第二矩阵进行矩阵加法,输出n×m维的第四矩阵;
对所述第四矩阵进行分类,输出所述第四矩阵对应的多个实体标注的概率,并根据多个所述概率确定所述待识别文本对应的实体标注;
根据所述待识别文本对应的实体标注,输出所述待识别文本对应的命名实体。
2.如权利要求1所述的命名实体识别方法,其特征在于,所述将所述待识别文本转换为n×k维的第一矩阵之后,还包括:
向所述n×k维的第一矩阵加入预设的g维的位置向量,得到n×(k+g)维的加入位置向量的第一矩阵。
3.如权利要求1所述的命名实体识别方法,其特征在于,所述对所述第一矩阵进行多层卷积层卷积,其中对所述多层卷积层中卷积核的通道数为m的最后一层卷积层进行4次卷积操作,得到4个并行的n×m维的第二矩阵,包括:
对所述第一矩阵进行预设的i层卷积层卷积后,得到n×m维的第五矩阵,所述i层卷积层中每层卷积层的卷积核的通道数为m;
通过预设的第一卷积核为j×m维的卷积层对所述第五矩阵进行4次卷积,输出4个并行的n×m维的所述第二矩阵,所述第一卷积核的通道数为m。
4.如权利要求3所述的命名实体识别方法,其特征在于,所述对所述第一矩阵进行预设的i层卷积层卷积后,得到n×m维的第五矩阵,包括:
通过第二卷积核为1×k维的第1层卷积层对所述第一矩阵进行卷积,输出n×m维的第六矩阵,所述第二卷积核的通道数为m;
对所述第五矩阵进行第2层卷积层至第i层卷积层卷积后,输出n×m维的第五矩阵,其中所述第2层卷积层至第i层卷积层的卷积核均为所述第一卷积核。
5.如权利要求1所述的命名实体识别方法,其特征在于,所述对4个所述第二矩阵中的3个所述第二矩阵进行注意力权重自适应后得到的n×m维第三矩阵,将所述第三矩阵与剩余的1个所述第二矩阵进行矩阵加法,得到n×m维的第四矩阵,包括:
对第1个所述第二矩阵与第2个所述第二矩阵的转置矩阵进行矩阵乘法,得到n×n维的第七矩阵;
对所述第七矩阵与第3个所述第二矩阵进行矩阵乘法,得到n×m维的所述第三矩阵;
对所述第三矩阵与第4个所述第二矩阵进行矩阵加法,得到n×m维的所述第四矩阵。
6.如权利要求1所述的命名实体识别方法,其特征在于,所述对所述第四矩阵进行分类,输出第四矩阵对应的多个实体标注的概率,并根据多个所述概率确定所述待识别文本对应的实体标注,包括:
将所述第四矩阵输入到条件随机场模型,输出第四矩阵对应的多个实体标注的概率,并根据多个所述概率确定所述待识别文本对应的实体标注。
7.如权利要求1所述的命名实体识别方法,其特征在于,所述对所述第四矩阵进行分类,输出第四矩阵对应的多个实体标注的概率,并根据多个所述概率确定所述待识别文本对应的实体标注,包括:
将所述第四矩阵输入到全连接层后,再通过softmax函数输出第四矩阵对应的多个实体标注的概率,并根据多个所述概率确定所述待识别文本对应的实体标注。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010087110.1/1.html,转载请声明来源钻瓜专利网。