[发明专利]一种实体识别方法、装置及电子设备有效
申请号: | 202011103763.0 | 申请日: | 2020-10-15 |
公开(公告)号: | CN112270179B | 公开(公告)日: | 2021-11-09 |
发明(设计)人: | 肖杰;莫永卓;赵顺峰;练睿 | 申请(专利权)人: | 和美(深圳)信息技术股份有限公司 |
主分类号: | G06F40/279 | 分类号: | G06F40/279;G06N3/04;G06N3/08 |
代理公司: | 北京锺维联合知识产权代理有限公司 11579 | 代理人: | 安娜 |
地址: | 518040 广东省深圳市福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 实体 识别 方法 装置 电子设备 | ||
本公开提供一种实体识别方法、装置以及电子设备,方法包括以下步骤:获取待识别信息;根据待识别信息,得到第一目标向量;将第一目标向量分别投影到多个空间模型中,得到多个投影模型;根据多个投影模型,得到第二目标向量;根据第二目标向量,确定目标第二标签;输出目标第二标签,目标第二标签表征在待识别信息内识别到的实体;其中,多个空间模型相互存在差异,且每一空间模型均对应至少一个第一标签,每一第一标签均对应多个第二标签。本申请通过将第一目标向量投影到多个空间模型内,使得在确定目标第二标签时,只需要从目标第一标签对应的第二标签中确定目标第二标签即可,大大减小了确定目标第二标签的运算量。
技术领域
本发明涉及自然语言理解领域,尤其涉及一种实体识别方法、装置及电子设备。
背景技术
在自然语言理解技术领域,在解析一句话的语义时,需要对句子中的实体进行识别。在一些方法中,采用直接建模的方法,通过调整网络结构(将卷积神经网络、循环神经网络等网络堆砌起来,构成新的深度网络)、调整损失函数(采用局部和全局损失函数进行综合决策)、加入标签特征(标签树转化为标签球形嵌入、标签图嵌入)等方式来优化模型。在一些情况下,一些学者不考虑标签的上下级联系,直接对底层标签进行建模。通过加入预训练模型、标签嵌入等方式来优化模型。但由于大多场景下,标签的数量都是非常多的,采用上述模型进行识别,会因为标签数量多,导致运算量过大等问题。
发明内容
有鉴于此,本发明提供一种实体识别方法、装置及电子设备,至少部分解决现有技术中存在的问题。
根据本申请的一方面,本申请提供一种实体识别方法,包括以下步骤:
获取待识别信息;
根据所述待识别信息,得到第一目标向量;
将所述第一目标向量分别投影到多个空间模型中,得到多个投影模型;
根据多个所述投影模型,得到第二目标向量;
根据所述第二目标向量,确定目标第二标签;
输出所述目标第二标签,所述目标第二标签表征在所述待识别信息内识别到的实体;
其中,多个空间模型相互存在差异,且每一所述空间模型均对应至少一个第一标签,每一所述第一标签均对应多个第二标签,所述第二目标向量能够表征所述第一目标向量或所述待识别信息与每一所述空间模型的关联度,以从至少一个所述第一标签内确定出目标第一标签。
在本公开的一种示例性实施例中,所述将所述第一目标向量分别投影到多个空间模型中,得到多个投影模型,包括:
根据所述待识别信息确定投影方法;
根据所述投影方法,将所述第一目标向量分别投影到多个空间模型中,得到多个投影模型。
在本公开的一种示例性实施例中,所述投影方法包括:极坐标变换、傅里叶变换、拉普拉斯变换、高斯变换、黎曼流形变换。
在本公开的一种示例性实施例中,所述根据多个所述投影模型,得到第二目标向量,包括:
计算每一所述空间模型的权重,得到每一所述空间模型对应的权重表征向量;
根据整合规则,将多个投影模型与多个所述权重表征向量整合为第二目标向量。
在本公开的一种示例性实施例中,所述计算每一所述空间模型的权重,得到每一所述空间模型对应的权重表征向量,包括:
获取每一所述空间模型对应的权重矩阵;
根据每一所述空间模型对应的权重矩阵和投影向量,得到每一所述空间模型的权重;
根据每一空间模型对应的标签表征向量和权重,得到每一所述空间模型对应的权重表征向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于和美(深圳)信息技术股份有限公司,未经和美(深圳)信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011103763.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种自适应式太阳能电池板倾角调节安装支架
- 下一篇:一种天线辅助固定装置