[发明专利]语义拒识方法、语义拒识装置、交通工具及介质有效
申请号: | 202110769934.1 | 申请日: | 2021-07-08 |
公开(公告)号: | CN113221580B | 公开(公告)日: | 2021-10-12 |
发明(设计)人: | 韩传宇;易晖;翁志伟 | 申请(专利权)人: | 广州小鹏汽车科技有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/284;G06K9/62;G06F9/451;G10L15/26;G10L15/06;G10L15/02;G10L15/18 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 邵泳城 |
地址: | 510640 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语义 方法 装置 交通工具 介质 | ||
1.一种语义拒识方法,其特征在于,所述语义拒识方法包括:
获取语音请求的文本以及所述文本对应的出词置信度;
根据所述文本以及对应的所述出词置信度生成置信度特征,所述置信度特征包括所述文本和所述文本对应的分字置信度;
将上下文的所述置信度特征合并生成目标置信度特征;
利用训练好的语义拒识模型对所述目标置信度特征进行预测得到拒识结果,所述语义拒识模型根据预设多模态模型训练得到;
其中,所述利用训练好的语义拒识模型对所述目标置信度特征进行预测得到拒识结果包括:
确定所述目标置信度特征的起止位;
设置所述目标置信度特征的超参数;
根据所述起止位和所述超参数对所述目标置信度特征进行补齐操作;
根据补齐后的所述目标置信度特征确定分字特征向量、分句特征向量、位置特征向量和所述置信度特征向量;
根据所述分字特征向量、所述分句特征向量、所述位置特征向量提取文本编码信息;
根据所述置信度特征向量提取置信度编码信息;
拼接所述文本编码信息和所述置信度编码信息以做自注意力特征融合;
利用激活函数对所述自注意力特征融合的结果进行处理以得到所述拒识结果。
2.根据权利要求1所述语义拒识方法,其特征在于,所述根据所述文本以及对应的所述出词置信度构造生成置信度特征包括:
根据所述文本对应的出词置信度确定所述文本的分字置信度;
对所述分字置信度进行归一化处理以构建置信度词表;
根据所述文本和所述置信度词表生成所述置信度特征。
3.根据权利要求1所述语义拒识方法,其特征在于,所述将上下文的所述置信度特征合并生成目标置信度特征包括:
根据所述语音请求的设备标识和语音采集时间对对应的所述置信度特征进行排序;
将所述设备标识相同且处于预设倾听时长内的相邻所述置信度特征合并生成所述目标置信度特征。
4.根据权利要求1所述语义拒识方法,其特征在于,所述根据所述分字特征向量、所述分句特征向量、所述位置特征向量提取文本编码信息包括:
通过bert-encoder模型对所述分字特征向量、所述分句特征向量、所述位置特征向量进行特征提取以得到所述文本编码信息,所述bert-encoder模型包括多个muti-head-attention层、dense层和layer_norm层;
所述根据所述置信度特征向量提取置信度编码信息,包括:
对所述置信度特征向量做单层双向的lstm特征提取以得到所述置信度编码信息。
5.根据权利要求1所述语义拒识方法,其特征在于,所述语义拒识方法还包括:
获取训练语音请求的训练文本以及所述训练文本对应的训练出词置信度;
根据所述训练文本以及对应的所述训练出词置信度生成训练置信度特征,所述训练置信度特征包括所述训练文本和所述训练文本对应的训练分字置信度;
将上下文的所述训练置信度特征合并生成目标训练置信度特征;
确定所述目标训练置信度特征的训练识别结果;
利用所述目标训练置信度特征和所述训练识别结果对预设多模态模型进行训练以得到训练好的所述语义拒识模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州小鹏汽车科技有限公司,未经广州小鹏汽车科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110769934.1/1.html,转载请声明来源钻瓜专利网。