[发明专利]文本识别方法、文本识别装置以及可读存储介质在审

申请号：	202211679806.9	申请日：	2022-12-26
公开（公告）号：	CN116150318A	公开（公告）日：	2023-05-23
发明（设计）人：	陈瑶;林聚财;沈芳婷;殷俊	申请（专利权）人：	浙江大华技术股份有限公司
主分类号：	G06F16/33	分类号：	G06F16/33;G06F40/30;G06N3/0442;G06N3/0464;G06N3/08
代理公司：	深圳市威世博知识产权代理事务所(普通合伙) 44280	代理人：	严翠霞
地址：	310051 浙江***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	文本识别方法装置以及可读存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种文本识别方法，其特征在于，所述文本识别方法包括：

获取待识别文本的嵌入层表示；

基于所述嵌入层表示分别提取所述待识别文本的槽位语义表示和意图语义表示；

将所述槽位语义表示和所述意图语义表示输入输出层，获取所述待识别文本的槽位标签和意图标签；

根据所述槽位标签和所述意图标签获取所述待识别文本的文本信息。

2.根据权利要求1所述的文本识别方法，其特征在于，

所述基于所述嵌入层表示分别提取所述待识别文本的槽位语义表示和意图语义表示，包括：

利用文本识别模型中的第一神经网络模型从所述嵌入层表示提取所述待识别文本的槽位语义表示；

利用所述文本识别模型中的第二神经网络模型从所述嵌入层表示提取所述待识别文本的意图语义表示。

3.根据权利要求1所述的文本识别方法，其特征在于，

所述基于所述嵌入层表示分别提取所述待识别文本的槽位语义表示和意图语义表示，包括：

利用所述文本识别模型中的神经网络模型从所述嵌入层表示提取所述待识别文本的槽位语义表示以及中间意图语义表示；

对所述中间意图语义表示进行降维处理，获取所述待识别文本的意图语义表示。

4.根据权利要求1至3任一项所述的文本识别方法，其特征在于，

所述文本识别方法，还包括：

利用槽位门控模块融合所述意图语义表示，以及若干字词的槽位语义表示，获取所述槽位语义表示的注意力权重；

将所述槽位语义表示及其注意力权重输入所述输出层，获取所述待识别文本的槽位标签。

5.根据权利要求1至3任一项所述的文本识别方法，其特征在于，

所述文本识别模型中的神经网络模型为卷积神经网络、循环神经网络和/或预训练模型。

6.根据权利要求1所述的文本识别方法，其特征在于，

所述文本识别方法，还包括：

利用注意力模块对所述嵌入层表示进行处理；

和/或，利用注意力模块对神经网络模型输出的中间槽位语义表示，和/或中间意图语义表示进行处理。

7.根据权利要求6所述的文本识别方法，其特征在于，

所述文本识别模型包括嵌入所述注意力模块的神经网络模型，所述神经网络模型根据输入的嵌入层表示输出所述注意力模块处理后的槽位语义表示，和/或意图语义表示。

8.根据权利要求1所述的文本识别方法，其特征在于，

所述文本识别方法还包括：

获取待训练文本的预测槽位标签和预测意图标签；

基于所述预测槽位标签和预测意图标签对文本识别模型进行训练；

所述基于所述预测槽位标签和预测意图标签对文本识别模型进行训练，包括：

基于所述预测槽位标签与真实槽位标签的槽位识别损失，以及槽位损失权重，其中，所述槽位识别损失与所述槽位损失权重呈反相关关系；

基于所述预测意图标签与真实意图标签的意图识别损失，以及，意图损失权重，其中，所述意图识别损失与所述意图损失权重呈反相关关系；

利用所述槽位损失权重和所述意图识别损失，获取所述槽位识别损失和所述意图识别损失的加权和，获取所述文本识别模型的联合损失值；

按照所述联合损失值对所述文本识别模型进行训练。

9.根据权利要求1所述的文本识别方法，其特征在于，

所述文本识别方法，还包括：

获取所述待识别文本的历史对话信息，并获取所述历史对话信息的历史嵌入层表示；

基于所述历史嵌入层表示提取所述历史对话信息的历史信息语义表示；

将所述待识别文本的意图语义表示与所述历史信息语义表示进行融合，并将融合表示输入所述输出层，获取所述待识别文本的意图标签。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于浙江大华技术股份有限公司，未经浙江大华技术股份有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202211679806.9/1.html，转载请声明来源钻瓜专利网。

上一篇：一种多投影光场图像合成方法及系统
下一篇：光纤气体传感装置、方法及电缆接头局部放电判定系统

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]文本识别方法、文本识别装置以及可读存储介质在审

专利文献下载