[发明专利]基于Star-Transformer的口语理解方法、系统及设备有效
申请号: | 202010804529.4 | 申请日: | 2020-08-13 |
公开(公告)号: | CN111951803B | 公开(公告)日: | 2022-12-16 |
发明(设计)人: | 刘美玲;马凯欣;于洋 | 申请(专利权)人: | 东北林业大学 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/26;G10L15/18;G06F16/33 |
代理公司: | 哈尔滨市松花江专利商标事务所 23109 | 代理人: | 时起磊 |
地址: | 150040 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 star transformer 口语 理解 方法 系统 设备 | ||
基于Star‑Transformer的口语理解方法、系统及设备,属于语言处理技术领域。本发明是为了解决利用现有的神经网络对口语进行识别存在的准确度较低的问题。本发明所述的方法首先利用Star‑Transformer对口语语音信息对应文本序列的特征矩阵进行信息提取;然后使用双向门控循环单元对Star‑Transformer提取的全局信息和局部信息进行整合,最后将插槽预测的概率最大的意图作为输出结果。主要用于口语的计算机理解。
技术领域
本发明涉及口语的理解方法和系统;属于语言处理技术领域。
背景技术
随着人工智能的发展,基于深度神经网络的模型对语言识别能力越来越高,智能语音助手也相应产生;比如点播歌曲、上网购物,或是了解天气预报,它也可以对智能家居设备进行控制,比如打开窗帘、设置冰箱温度、提前让热水器升温等;语言识别技术在人工智能有着不可替代的作用;
随着深度学习技术的发展,利用神经网络对自然语言进行识别,已经能够取得较为不错的效果;但是由于自然语言具有一定的模糊性和歧义性,如何更准确的识别到人们想表达的意愿仍然是一个巨大的挑战;针对于自然语言的口语而言,口语表达相对简单且更加随意,有事甚至不符合常规的表达逻辑,而且可能具有更多的意思表达可能性,所以口语更加具有模糊性和歧义性,利用现有的神经网络对于口语的识别时,对应的准确度(准确的识别到人们想表达的意愿)和准确率较低,都有待于进一步提高。
发明内容
本发明是为了解决利用现有的神经网络对口语进行识别存在的准确度较低的问题;现提供一种基于Star-Transformer的口语理解方法、系统及设备。
基于Star-Transformer的口语理解方法,首先利用Star-Transformer对口语语音信息对应文本序列的特征矩阵进行信息提取;然后使用双向门控循环单元对Star-Transformer提取的全局信息和局部信息进行整合,最后将插槽预测的概率最大的意图作为输出结果。
进一步地,所述方法还包括采集口语语音信息并将口语语音转换为文本序列,获得文本序列的特征矩阵的步骤。
进一步地,所述利用Star-Transformer对口语语音信息对应文本序列的特征矩阵进行信息提取的过程包括以下步骤:
口语语音信息对应文本序列的特征矩阵记为H=[h1,…,hn],其中hj表示第j个字的特征,n为文本长度;对于查询向量q∈R1×d,注意力公式如下:
其中,K=HWk,V=HWv,Wk和Wv为可学习参数;查询向量q为1×d的实数矩阵,表示查询向量q的列数;
由注意力公式得到多头注意力公式:
MultiHead(q,H)=concat(head1,…,headh)Wo (2)
headi=Attention(qWiQ,HWiK,HWiv),i∈[1,h] (3)
其中,h为头的个数,WiQ,WiK,Wiv,Wo为可学习参数;concat(·)为concat函数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北林业大学,未经东北林业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010804529.4/2.html,转载请声明来源钻瓜专利网。
- 基于Transformer+LSTM神经网络模型的商品销量预测方法及装置
- 一种基于Transformer模型自然场景文字识别方法
- 一种深度Transformer级联神经网络模型压缩算法
- 点云分割方法、系统、介质、计算机设备、终端及应用
- 基于Transformer的中文智能对话方法
- 一种基于改进Transformer模型的飞行器故障诊断方法和系统
- 一种基于Transformer模型的机器翻译模型优化方法
- 基于Transformer和增强交互型MPNN神经网络的小分子表示学习方法
- 基于U-Transformer多层次特征重构的异常检测方法及系统
- 基于EfficientDet和Transformer的航空图像中的飞机检测方法