[发明专利]离线导航的定制和实现方法及装置有效
申请号: | 201811590577.7 | 申请日: | 2018-12-25 |
公开(公告)号: | CN109671421B | 公开(公告)日: | 2020-07-10 |
发明(设计)人: | 甘津瑞;邓建凯;张顺 | 申请(专利权)人: | 苏州思必驰信息科技有限公司 |
主分类号: | G10L13/02 | 分类号: | G10L13/02;G10L15/06;G10L15/18;G10L15/22;G10L15/26 |
代理公司: | 北京商专永信知识产权代理事务所(普通合伙) 11400 | 代理人: | 方挺;黄谦 |
地址: | 215123 江苏省苏州市苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 离线 导航 定制 实现 方法 装置 | ||
1.一种离线导航的定制方法,包括:
响应于开发者开发离线导航技能,加载内置的第一语音识别模型和第一语义理解模型;
获取开发者增加的新的功能和定制的对话逻辑,其中,所述新的功能包括新的模式、新的地名和新的口语化表述,所述对话逻辑包括对话管理、播报和指令;
响应于开发者发布所述离线导航技能,训练与所述新的功能关联的第二语音识别模型和第二语义理解模型,训练与所述对话逻辑关联的对话模型,并将所述第一语音识别模型、第一语义理解模型、所述第二语音识别模型、所述第二语义理解模型和所述对话模型共同生成离线导航包。
2.一种离线导航的实现方法,包括:
采集用户的音频数据;
利用权利要求1所述的离线导航包对所述音频数据进行内置语音识别和开发者定制化语音识别,获取融合识别文本;
利用权利要求1所述的离线导航包对所述融合识别文本进行内置语义理解和开发者定制化语义理解,获取融合语义理解结果;
利用权利要求1所述的离线导航包对所述融合语义理解结果进行开发者定制化响应。
3.根据权利要求2所述的方法,其中,所述对所述音频数据进行内置语音识别和开发者定制化语音识别,获取融合识别文本包括:
将所述音频数据输入至内置识别模型,获取所述内置识别模型的第一语音识别结果;
将所述音频数据输入至定制化识别模型,获取第二语音识别结果;
对所述第一语音识别结果和所述第二语音识别结果进行融合以得到融合语音识别结果。
4.根据权利要求3所述的方法,其中,所述对所述融合识别文本进行内置语义理解和开发者定制化语义理解,获取融合语义理解结果包括:
将所述音频数据输入至内置语义模型,获取所述内置识别模型的第一语义理解结果;
将所述音频数据输入至定制化语义模型,获取第二语义理解结果;
对所述第一语义理解结果和所述第二语义理解结果进行融合以得到融合语义理解结果。
5.根据权利要求4所述的方法,其中,所述对所述第一语音识别结果和所述第二语音识别结果进行融合以得到融合语音识别结果包括:
至少基于可信度、耗时、音频和识别文本的时间映射,选出一个最佳识别结果作为融合语音识别结果;
所述对所述第一语义理解结果和所述第二语义理解结果进行融合以得到融合语义理解结果包括:
至少基于可信度、耗时、上下文,选出一个最佳识别结果作为融合语义理解结果。
6.根据权利要求2-5中任一项所述的方法,其中,所述采集用户的音频数据包括:
对用户的输入音频进行声音活性检测,采集预设时间内的音频数据。
7.根据权利要求6所述的方法,其中,所述对所述融合语义理解结果进行开发者定制化响应包括:
将所述语义理解结果输入至对话模型,并执行开发者定制的对话管理、播报和指令。
8.根据权利要求6所述的方法,其中,在对所述融合语义理解结果进行开发者定制化响应之后,所述方法还包括:
判断是否为多轮对话;
若是,继续对用户的新的音频数据进行识别、理解和响应;
若否,结束对话。
9.一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1至8任一项所述方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州思必驰信息科技有限公司,未经苏州思必驰信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811590577.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于磁固耦合的薄膜型主动声学超材料
- 下一篇:一种获取纯净语音的录音方法