[发明专利]信息识别方法、装置、电子设备及存储介质在审
申请号: | 202111607237.2 | 申请日: | 2021-12-24 |
公开(公告)号: | CN114254644A | 公开(公告)日: | 2022-03-29 |
发明(设计)人: | 刘东阳;张阳 | 申请(专利权)人: | 建信金融科技有限责任公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F16/35;G06N3/08 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 吕朝蕙 |
地址: | 200120 上海市浦东新区中国(*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信息 识别 方法 装置 电子设备 存储 介质 | ||
本公开提供了一种信息识别方法、装置、电子设备、存储介质及计算机程序产品,涉及人工智能技术领域,可应用于金融领域或其他领域。该信息识别方法包括:对文本进行特征提取,得到包含第一事件主体和第一事件主体类别的第一特征向量;使用预训练模型对文本进行特征提取,得到包含第二事件主体和第二事件主体类别的第二特征向量;利用全连接神经网络依据第一特征向量和第二特征向量得到针对文本的第一命名实体识别结果。
技术领域
本公开涉及人工智能技术领域,更具体地,涉及一种信息识别方法、装置、电子设备、存储介质和计算机程序产品。
背景技术
随着互联网的发展,每天会产生海量文本信息,但是在面对海量的文本信息时,如何快速、准确地获取用户关注的信息成为一大难题。
传统技术中通常基于深度学习的方法来对实现命名实体识别,但基于深度学习方法进行命名实体识别的过程中,通常需要以训练好的词向量或者随机初始化的字向量作为输入,不仅识别效果差,而且识别效率低下,甚至在一些复杂的语境下,导致识别失败。
发明内容
鉴于上述问题,本公开提供了一种信息识别方法、装置、电子设备、存储介质和计算机程序产品。
根据本公开的第一个方面,提供了一种信息识别方法,包括:
对文本进行特征提取,得到包含第一事件主体和第一事件主体类别的第一特征向量;
使用预训练模型对文本进行特征提取,得到包含第二事件主体和第二事件主体类别的第二特征向量;
利用全连接神经网络依据第一特征向量和第二特征向量得到针对文本的第一命名实体识别结果。
根据本公开的实施例,其中,使用预训练模型对文本进行特征提取,得到包含第二事件主体和第二事件主体类别的第二特征向量,包括:
将文本划分为训练数据和验证数据;
使用预训练模型对训练数据和验证数据进行特征提取,得到包含第二事件主体和第二事件主体类别的第二特征向量。
根据本公开的实施例,其中,预训练模型包括第一预训练模型和第二预训练模型,所述方法还包括:
获取使用第一预训练模型得到的第一命名实体识别结果;
获取使用第二预训练模型得到的第二命名实体识别结果;
将使用第一预训练模型得到的第一命名实体识别结果与使用第二预训练模型得到的第二命名实体识别结果进行融合,得到针对文本的第三命名实体识别结果。
根据本公开的实施例,其中,利用全连接神经网络依据第一特征向量和第二特征向量得到针对文本的命名实体识别结果,包括:
对第一特征向量和第二特征向量进行加和,得到加和后的特征向量;
利用全连接神经网络对加和后的特征向量进行分类,得到针对文本的第一命名实体识别结果。
根据本公开的实施例,其中,对文本进行特征提取,得到包含第一事件主体和第一事件主体类别的第一特征向量,包括:
对文本进行标注,以提取第一事件主体和第一事件主体类别;
将第一事件主体和第一事件主体类别表示为包含第一事件主体和第一事件主体类别的第一特征向量。
根据本公开的实施例,其中,至少基于以下方法对文本进行标注:BIOES标注法或BIO标注法。
根据本公开的实施例,其中,将使用第一预训练模型得到的第一命名实体识别结果与使用第二预训练模型得到的第二命名实体识别结果进行融合,得到针对文本的第三命名实体识别结果,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于建信金融科技有限责任公司,未经建信金融科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111607237.2/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置