[发明专利]车载语音分析方法、系统、存储介质以及设备有效
申请号: | 201910027138.3 | 申请日: | 2019-01-11 |
公开(公告)号: | CN109767758B | 公开(公告)日: | 2021-06-08 |
发明(设计)人: | 桂进军;刘冶;徐振涛;李宏浩;叶思聪;郑燕璇;潘炎;印鉴 | 申请(专利权)人: | 中山大学;广州赫炎大数据科技有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/14;G10L15/22;G10L15/26 |
代理公司: | 广州骏思知识产权代理有限公司 44425 | 代理人: | 吴静芝 |
地址: | 510275 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 车载 语音 分析 方法 系统 存储 介质 以及 设备 | ||
本发明涉及一种车载语音分析方法、系统、存储介质以及设备,其中,方法包括:获取待识别的车载语音信号以及汽车的标识信息;根据待识别的车载语音信号,调用基于Kaldi训练的语音识别模型、基于CMUSphinx训练的语音识别模型以及多个语音识别服务商接口,获得多个待融合的语音文本;通过多源文本融合模型将多个待融合的语音文本进行融合,获得融合后的语音文本;根据汽车的标识信息以及语音文本,在汽车指令数据库中获得匹配的汽车操作指令。本发明提高了语音识别的准确性,提高了人机交互的效率和体验,使机器能更好地理解人类语言。
技术领域
本发明涉及语音控制领域,特别是涉及一种车载语音分析方法、系统、存储介质以及设备。
背景技术
随着计算机技术的快速发展,利用计算机来实现语音识别已经日渐成熟。近年来,实现人机之间更加智能化的有效交互,构建更加高效流畅的人机交流环境已经成为当前信息技术领域不可或缺的热点话题。语音识别技术是当前实现人机交互最便捷的方式,它使得语音输入、语音搜索、智能家居控制等各种语音识别产品受到广大用户的青睐。
在汽车领域,相比于传统的按键、触屏操作,通过语音识别的方式来完成车辆操作和控制已经成为车载智能的标准配置,通过语音识别方式,可以减少驾驶员视线和双手的转移,有利于驾驶员集中精力驾驶,提高行车安全。
发明人在实现本发明的过程中,发现一般的车载智能语音操作控制,需要遵循车载系统的语音规律,语音识别准确率低,人机交互体验显得呆板,不灵活。
发明内容
基于此,本发明的目的在于,提供一种车载语音分析方法,其具有能更精确地进行语音识别,使人机交互的体验更高效的优点。
一种车载语音分析方法,包括如下步骤:
获取待识别的车载语音信号以及汽车的标识信息;
根据待识别的车载语音信号,调用基于Kaldi训练的语音识别模型、基于CMUSphinx训练的语音识别模型以及多个语音识别服务商接口,获得多个待融合的语音文本;
通过多源文本融合模型将多个所述待融合的语音文本进行融合,获得融合后的语音文本;
根据所述汽车的标识信息以及所述语音文本,在汽车指令数据库中获得匹配的汽车操作指令。
本发明通过调用多个语音识别服务商接口、基于Kaldi训练的语音识别模型、以及基于CMUSphinx训练的语音识别模型,获得多个待融合的语音文本,再将获得的多个待融合的语音文本进行融合,以融合后的语音文本来匹配控制汽车的操作指令,提高了语音识别的准确性,提高了人机交互的效率和体验,使机器能更好地理解人类语言。
在一个实施例中,所述根据所述汽车的标识信息以及所述语音文本,在汽车指令数据库中获得匹配的汽车操作指令的步骤,包括:
根据所述汽车的标识信息,从汽车指令数据库中查询获得对应汽车的指令文字集以及操作指令集;
将所述语音文本和所述指令文字集中的各指令文字分别进行语义角色标注;
计算语义角色标注后的语音文本与语义角色标注后的各指令文字的语义相似度、词形相似度和句长相似度;
将所述语义相似度、词形相似度和句长相似度按照预设的权重进行累加,获得最高的累加值对应的指令文字或者按累加值降序排列时在预设范围内的累加值对应的指令文字,并将所述指令文字对应的操作指令作为匹配的汽车操作指令。
通过结合语义相似度、词形相似度和句长相似度进行相似度匹配,提高了操作指令的匹配精确度。
在一个实施例中,所述语义相似度的计算方式为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学;广州赫炎大数据科技有限公司,未经中山大学;广州赫炎大数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910027138.3/2.html,转载请声明来源钻瓜专利网。