[发明专利]车载语音分析方法、系统、存储介质以及设备有效
申请号: | 201910027138.3 | 申请日: | 2019-01-11 |
公开(公告)号: | CN109767758B | 公开(公告)日: | 2021-06-08 |
发明(设计)人: | 桂进军;刘冶;徐振涛;李宏浩;叶思聪;郑燕璇;潘炎;印鉴 | 申请(专利权)人: | 中山大学;广州赫炎大数据科技有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/14;G10L15/22;G10L15/26 |
代理公司: | 广州骏思知识产权代理有限公司 44425 | 代理人: | 吴静芝 |
地址: | 510275 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 车载 语音 分析 方法 系统 存储 介质 以及 设备 | ||
1.一种车载语音分析方法,其特征在于,包括如下步骤:
获取待识别的车载语音信号以及汽车的标识信息;
根据待识别的车载语音信号,调用基于Kaldi训练的语音识别模型、基于CMUSphinx训练的语音识别模型以及多个语音识别服务商接口,获得多个待融合的语音文本;
通过多源文本融合模型将多个所述待融合的语音文本进行融合,获得融合后的语音文本;
根据所述汽车的标识信息以及所述语音文本,在汽车指令数据库中获得匹配的汽车操作指令;
所述根据所述汽车的标识信息以及所述语音文本,在汽车指令数据库中获得匹配的汽车操作指令的步骤,包括:
根据所述汽车的标识信息,从汽车指令数据库中查询获得对应汽车的指令文字集以及操作指令集;
将所述语音文本和所述指令文字集中的各指令文字分别进行语义角色标注;
计算语义角色标注后的语音文本与语义角色标注后的各指令文字的语义相似度、词形相似度和句长相似度;
将所述语义相似度、词形相似度和句长相似度按照预设的权重进行累加,获得最高的累加值对应的指令文字或者按累加值降序排列时在预设范围内的累加值对应的指令文字,并将所述指令文字对应的操作指令作为匹配的汽车操作指令;
所述语义相似度的计算方式为:
上述公式中,T1和T2分别表示语义角色标注后的语音文本与语义角色标注后的指令文字;Similarity(T1,T2)表示T1和T2之间的语义相似度;m,n分别表示T1中标注的语义角色的数量和T2中标注的语义角色的数量;(i,j)∈{(p,q)|rq,rq∈r(F1)∩r(F2),1≤p≤m,1≤q≤n};v1,v2分别表示T1中的动词和T2中的动词,Similarity(v1,v1)为动词v1和动词v2的词语相似度;ei和ej分别表示T1中的论元和T2中的论元,Similarity(ei,ej)为论元ei和论元ej间的相似度;α为谓词相似度在全句中所占的权重;
所述动词v1和动词v2的词语相似度的计算方式为:
其中,词向量表示v1=(x1,x2,…xn)和v2=(y1,y2,…yn),其中,n表示向量维度:
在T1和T2中有一个论元数量等于或大于2个,所述论元ei和论元ej的相似度的计算方式为:
其中,Smn为论元ei中第M个词和论元ej中第N个词之间的相似度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学;广州赫炎大数据科技有限公司,未经中山大学;广州赫炎大数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910027138.3/1.html,转载请声明来源钻瓜专利网。