[发明专利]语义识别方法、模型、存储介质和装置在审
申请号: | 201811365278.3 | 申请日: | 2018-11-16 |
公开(公告)号: | CN109684626A | 公开(公告)日: | 2019-04-26 |
发明(设计)人: | 杨志明;王来奇;王泳 | 申请(专利权)人: | 深思考人工智能机器人科技(北京)有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06N3/04 |
代理公司: | 北京德琦知识产权代理有限公司 11018 | 代理人: | 谢安昆;宋志强 |
地址: | 100084 北京市海淀区上*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特征向量 向量 语义识别 卷积神经网络 存储介质 输出 矩阵 输入分类器 特征提取 文本转换 向量矩阵 词向量 双通道 准确率 分析 文本 | ||
本发明提供一种语义识别方法、存储介质和装置,包括:步骤11:将待分析文本转换为第一向量和第二向量后,分别执行步骤12和步骤13,第一向量为词向量矩阵,第二向量为字向量矩阵;步骤12:将第一向量输入第一卷积神经网络,输出第一特征向量;步骤13:将第二向量输入第二卷积神经网络,输出第二特征向量;步骤14:将第一特征向量和第二特征向量连接为第三特征向量;步骤15:将第三特征向量输入分类器,输出待分析文本的语义识别结果。基于本发明的方法,通过设置双通道卷积神经网络的特征提取,提高语义识别结果的准确率。
技术领域
本发明涉及人工智能领域,特别涉及一种语义识别方法、模型、存储介质和装置。
背景技术
随着网络智能设备数量的迅猛发展,设备的形态也各种各样,交互方式也各有不同,尤其随着语音识别技术公司的崛起,语音识别技术越来越成熟,应用的范围也越来越广,基于语音的人机对话技术被普遍认为是更加自然的人机交互方式。
人机对话技术的一个关键任务就是如何让聊天机器人理解用户的语句意图并将用户的输入正确地分类到相应的领域中,其性能直接影响到特定领域的人机对话质量。
现有技术中,通常采用单通道卷积神经网络(Convolutional Neural Network,CNN)进行语义特征提取,但是单通道CNN存在视角单一的缺陷,不能充分学习到语句的特征信息和语义信息,从而导致后续语句意图分类的准确性较差,影响应用推广。
发明内容
有鉴于此,本发明提供一种语义识别方法、模型、存储介质和装置,以解决目前语义识别输出结果准确率不高的问题。
本发明提供一种语义识别方法,包括:
步骤11:将待分析文本转换为第一向量和第二向量后,分别执行步骤12和步骤13,第一向量为词向量矩阵,第二向量为字向量矩阵;
步骤12:将第一向量输入第一卷积神经网络,输出第一特征向量;
步骤13:将第二向量输入第二卷积神经网络,输出第二特征向量;
步骤14:将第一特征向量和第二特征向量连接为第三特征向量;
步骤15:将第三特征向量输入分类器,输出待分析文本的语义识别结果。
本发明还提供一种非瞬时计算机可读存储介质,非瞬时计算机可读存储介质存储指令,指令在由处理器执行时使得处理器执行中上述的语义识别方法中的步骤。
本发明还提供一种语义识别装置,包括处理器和上述的非瞬时计算机可读存储介质。
本发明还提供一种语义识别模型,包括:
词向量生成模块:将待分析文本转换为第一向量,第一向量为词向量矩阵;
字向量生成模块:将待分析文本转换为第二向量,第二向量为字向量矩阵;
第一卷积神经网络:当输入第一向量时,输出第一特征向量;
第二卷积神经网络:当输入第二向量时,输出第二特征向量;
连接模块:将第一特征向量和第二特征向量连接为第三特征向量;
分类器:当第三特征向量输入分类器时,输出待分析文本的语义识别结果。
本发明采用双通道卷积运算进行特征提取,一个通道传入字级别的词向量,另一个通道传入词级别的词向量,利用细粒度的字级别词向量辅助词级别词向量捕捉自然语句更深层次的语义信息,从而提到语义识别结果的准确率,较于其他算法具有一定的优势。
附图说明
图1为本发明语义识别方法的流程图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深思考人工智能机器人科技(北京)有限公司,未经深思考人工智能机器人科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811365278.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:实体处理方法、装置和存储介质
- 下一篇:一种文本分类方法及装置