[发明专利]一种识别方法、装置、设备及存储介质有效
申请号: | 202110771579.1 | 申请日: | 2021-07-08 |
公开(公告)号: | CN113392649B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 万建伟;李松涛;贺凯;孙科;余非;裴卫民;冯文亮 | 申请(专利权)人: | 上海浦东发展银行股份有限公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F16/35;G06F40/216;G06N3/045 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 赵迎迎 |
地址: | 200000 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 识别 方法 装置 设备 存储 介质 | ||
1.一种识别方法,其特征在于,包括:
获取待识别序列,其中,所述待识别序列包括:待识别句子和待识别句子中的字符对应的词性信息;
通过查找词向量表,得到与所述待识别序列对应的待识别向量;
将所述待识别向量输入目标命名实体识别模型,得到所述待识别向量对应的第一类别概率;
所述目标命名实体识别模型中的self-attention方法通过如下公式实现:
其中,Q表示Query向量,K表示Key向量,V表示Value向量,Q=K=V,Q由两部分组成Qs表示句子部分,Qv表示词表部分,K与Q类似,表示向量的连接,dk表示Key向量的维度,表示句子中字符间的self-attention,表示单词词性与Q的self-attention;
所述句子中单个字符之间会进行self-attention操作;
所述词性信息与单个字符进行self-attention操作;
所述词性信息之间进行self-attention操作。
2.根据权利要求1所述的方法,其特征在于,所述待识别向量包括:至少一个待识别字符向量和至少一个待识别位置向量;
相应的,将所述待识别向量输入目标命名实体识别模型,得到所述待识别向量对应的第一类别概率,包括:
将所述至少一个待识别字符向量和至少一个待识别位置向量输入BERT模型,得到每个待识别字符向量对应的分数;
将所述每个待识别字符向量对应的分数输入softmax层,得到每个待识别字符向量对应的第一命名实体识别标签,其中,所述第一命名实体识别标签包括:待识别字符向量对应的类别概率。
3.根据权利要求1所述的方法,其特征在于,获取待识别序列包括:
获取待识别句子;
根据所述待识别句子查询词表,得到所述待识别句子中的字符对应的词性信息。
4.根据权利要求1所述的方法,其特征在于,在将所述待识别向量输入目标命名实体识别模型,得到所述待识别向量对应的第一类别概率之后,还包括:
将所述待识别向量对应的第一类别概率输入CRF层,得到待识别向量对应的目标类别概率,其中,所述CRF层的分数定义如下:
其中,为待识别向量对应的第一类别概率,xi为单个字符的位置索引,yi为类别标签的位置索引,表示从类别标签yi转移到yi+1的概率,X为待识别序列,y=(y1,y2,…,yn),y为序列X对应的类别标签;
根据序列X对应的类别标签计算得到目标概率:
其中,YX表示序列X对应的至少两个类别标签,表示遍历YX,S(X,y)表示CRF层的分数;
所述CRF层的损失函数为:
其中,n为句子最大长度。
5.根据权利要求1所述的方法,其特征在于,所述待识别向量包括:至少一个待识别字符向量、至少一个待识别位置向量和至少一个待识别分段向量;
相应的,将所述待识别向量输入目标命名实体识别模型,得到所述待识别向量对应的第一类别概率,包括:
将所述至少一个待识别字符向量、至少一个待识别位置向量和至少一个待识别分段向量输入BERT模型,得到每个待识别字符向量对应的分数;
将所述每个待识别字符向量对应的分数输入softmax层,得到每个待识别字符向量对应的第二命名实体识别标签,其中,所述第二命名实体识别标签包括:待识别字符向量对应的类别概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海浦东发展银行股份有限公司,未经上海浦东发展银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110771579.1/1.html,转载请声明来源钻瓜专利网。