[发明专利]离线导航的定制和实现方法及装置有效
申请号: | 201811590577.7 | 申请日: | 2018-12-25 |
公开(公告)号: | CN109671421B | 公开(公告)日: | 2020-07-10 |
发明(设计)人: | 甘津瑞;邓建凯;张顺 | 申请(专利权)人: | 苏州思必驰信息科技有限公司 |
主分类号: | G10L13/02 | 分类号: | G10L13/02;G10L15/06;G10L15/18;G10L15/22;G10L15/26 |
代理公司: | 北京商专永信知识产权代理事务所(普通合伙) 11400 | 代理人: | 方挺;黄谦 |
地址: | 215123 江苏省苏州市苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 离线 导航 定制 实现 方法 装置 | ||
本发明公开离线导航的定制和实现方法及装置,其中,一种离线导航的定制方法,包括:响应于开发者开发离线导航技能,加载内置的第一语音识别模型和第一语义理解模型;获取开发者增加的新的功能和定制的对话逻辑;响应于开发者发布所述离线导航技能,训练与所述新的功能关联的第二语音识别模型和第二语义理解模型,训练与所述对话逻辑关联的对话模型,并将所述第一语音识别模型、第一语义理解模型、所述第二语音识别模型、所述第二语义理解模型和所述对话模型共同生成离线导航包。本申请的方案能够实现一整套离线导航的语音对话功能并支持开发者的个性化定制。
技术领域
本发明属于离线导航技术领域,尤其涉及离线导航的定制和实现方法及装置。
背景技术
相关技术中,仅有某几家公司有对外提供离线导航所需要的基础语音技术。一些公司仅提供一项离线语音合成的基础技术,然后由导航公司将这两项基础技术集成到自己的APP中,来实现离线导航语音播报导航行程的功能。另一些公司,提供具备离线导航对话的对话式人工智能系统,然后由汽车厂商集成该对话式人工智能系统到自己的车机中,来实现离线导航语音对话的功能。
发明人在实现本申请的过程中发现,上述方案至少存在以下缺陷:
1、单方向输出:仅仅能提供离线时的语音合成播报能力,是设备对人的单方向的语音信息输出,而人无法对设备进行语音信息的输入。当人需要在离线导航过程中进行功能变更时,依然需要用手进行信息的输入,这在行驶过程中是极其不安全的。
2、集成能力差:采用线下交付和集成的方式,集成和调试成本非常高。仅适合大型企业,并不适合中小型企业和个人开发者。
3、识别语义的准确性和定制性不能兼容:由于离线导航中涉及到的POI(Point ofinteresting,兴趣点)都在千万量级,所以离线识别需要大量语料训练才能产出,故离线识别的更新成本和周期特别长,一般不接受定制。
4、对话定制性差:由于是通过线下集成和交付,所以整个离线导航对话的功能是靠开发者编码来实现的,要打通、维护和更新这个完整闭环,极大的占用精力和时间。
发明内容
本发明实施例提供一种离线导航的定制和实现方法及装置,用于至少解决上述技术问题之一。
第一方面,本发明实施例提供一种离线导航的定制方法,包括:响应于开发者开发离线导航技能,加载内置的第一语音识别模型和第一语义理解模型;获取开发者增加的新的功能和定制的对话逻辑;响应于开发者发布所述离线导航技能,训练与所述新的功能关联的第二语音识别模型和第二语义理解模型,训练与所述对话逻辑关联的对话模型,并将所述第一语音识别模型、第一语义理解模型、所述第二语音识别模型、所述第二语义理解模型和所述对话模型共同生成离线导航包。
第二方面,本发明实施例提供一种离线导航的实现方法,包括:采集用户的音频数据;对所述音频数据进行内置语音识别和开发者定制化语音识别,获取融合识别文本;对所述融合识别文本进行内置语义理解和开发者定制化语义理解,获取融合语义理解结果;对所述融合语义理解结果进行开发者定制化响应。
第三方面,本发明实施例提供一种离线导航的定制装置,包括:加载模块,配置为响应于开发者开发离线导航技能,加载内置的第一语音识别模型和第一语义理解模型;获取模块,配置为获取开发者增加的新的功能和定制的对话逻辑;生成模块,配置为响应于开发者发布所述离线导航技能,训练与所述新的功能关联的第二语音识别模型和第二语义理解模型,训练与所述对话逻辑关联的对话模型,并将所述第一语音识别模型、第一语义理解模型、所述第二语音识别模型、所述第二语义理解模型和所述对话模型共同生成离线导航包。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州思必驰信息科技有限公司,未经苏州思必驰信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811590577.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于磁固耦合的薄膜型主动声学超材料
- 下一篇:一种获取纯净语音的录音方法