[发明专利]一种带方言识别的话音控制系统在审
| 申请号: | 201611242191.8 | 申请日: | 2016-12-29 |
| 公开(公告)号: | CN106847277A | 公开(公告)日: | 2017-06-13 |
| 发明(设计)人: | 陈泳璿 | 申请(专利权)人: | 昶洧新能源汽车发展有限公司 |
| 主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/26;B60R16/037 |
| 代理公司: | 上海脱颖律师事务所31259 | 代理人: | 脱颖 |
| 地址: | 中国香*** | 国省代码: | 香港;81 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 方言 识别 话音 控制系统 | ||
相关申请的交叉引用
本申请要求2015年12月30日提交的美国临时专利申请No.62/272,710的优先权,所述临时专利申请的全部公开内容出于所有目的以引用的方式并入本文。
技术领域
本公开总体上涉及通过话音命令控制驾驶设备。
背景技术
汽车上的常规语音识别系统方便驾驶员和/或乘客通过话音命令来控制各种车辆功能。典型地,一个或多个麦克风可以被设置在汽车的整个舱室中并且连接到语音处理器以使用声学和语言建模技术来处理用户话音命令。话音模式数据被典型地存储在车载语音识别系统中的存储器内,并且从所述存储器检索话音模式数据以用于识别用户话音命令。
与常规车载语音识别系统相关联的一个问题是它在识别由带方言的用户提供的话音命令方面具有局限性。方言典型地是指单一语言的变体,它是讲该语言的人中的特定群体的特征。单一语言内的不同社群讲该相同语言的方式可能不同,这些方式将他们与其他社群区分开来。这些差异可以被认为是方言—不只是口音(字词发音的方式),更涉及语法、词汇、句法以及常用表达。在地区上或社会上与其他群体有某种程度隔离的群体通常会形成特征性方言。例如,在中国存在数千种方言,诸如广东话、上海话、四川话、福建话等等。
说不同方言的用户对常规车载语音识别系统提出的挑战在于,常规车载语音识别系统仅将用户输入映射到标准话音模式。也就是说,常规车载语音识别系统不配置成用来区分方言差异并且要求用户通过标准语言模式来输入话音命令。在中文的情况下,常规车载语音识别系统典型地要求用户通过普通话来输入话音命令。如果用户通过他/她的方言输入话音命令,那么常规车载语音系统一般不会正确地作出响应。
发明内容
诸实施例可以方便驾驶设备的用户提供具有方言的话音输入。方言翻译层可以被实现用于将用户话音输入翻译为标准话音模式,并且基于所翻译的话音模式,控制命令可以被产生以控制驾驶设备的各种功能和/或操纵所述驾驶设备。与常规车载语音识别系统相比较,本公开使得用户能够使用方言来提供话音输入,并且因此向用户提供操作驾驶设备的方便性。本公开通过考虑驾驶设 备的用户之间的方言差异来相对于常规车载语音识别系统提高命令识别准确性。
在一些实施例中,驾驶设备所在的地点可以由用户选择。当从用户接收到话音输入时,可以加载对应于所选地点的方言翻译单元。所接收的用户话音输入可以通过方言翻译单元来处理。方言翻译单元可以被配置成识别对于与所述方言翻译单元相关联的方言而言特有的方言特征。
在一些实施例中,在通过方言翻译单元处理之后,所翻译的用户输入可以进一步通过话音模式控制命令单元来处理。所述话音模式控制命令单元可以被配置成产生控制命令,以控制驾驶设备的各种功能,所述各种功能例如但不限于:起动驾驶设备、打开/关闭A/C单元、控制A/C单元(例如,调节温度和/或风性质)、打开/关闭娱乐系统、控制娱乐系统、打开/关闭某些安全特征、打开/关闭某些驾驶特征、调节座椅、调节方向盘、对周围环境拍摄照片和/或能够控制驾驶设备的各种功能的任何其他控制命令。在一些实施例中,话音控制命令单元可以被配置成产生控制命令以操纵驾驶设备。例如,可使得用户能够用他/她自己的方言提供话音输入以驾驶所述驾驶设备。例如,可使得用户能够指示驾驶设备转弯、加速、减速、停止、前进、停车和/或以任何其他方式操纵。
在一些实例中,方便驾驶设备的用户用方言提供话音输入可以包括自动地确定用户所在的地点。例如,与用户相关联的方言可以基于驾驶设备所在的位置来确定。在一些实例中,方便驾驶设备的用户用方言提供话音输入可以包括识别用户的话音、鉴别所述用户并且自动地确定与所述用户相关联的方言。在一些实例中,方便驾驶设备的用户用方言提供话音输入可以包括在服务器处执行本文描述的各种方言翻译操作。
在一些实例中,提供一种用于方便用户通过话音命令控制驾驶设备的方法,所述方法包括:
由处理器接收用户话音输入;
由所述处理器基于所述用户话音输入来确定输入话音模式;
由所述处理器基于所述输入话音模式来确定所述用户话音输入相关联的语言方言;
由所述处理器使用所述语言方言来将所述输入话音模式转换成标准话音模式;
由所述处理器基于标准话音模式来确定对应于所述用户话音输入的控制命令以用于操纵所述驾驶设备;以及
由所述处理器来实现所述控制命令的执行以控制所述驾驶设备。
在一些实例中,所述用户话音输入包括指示所述驾驶设备的平移和/或转动操纵的信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昶洧新能源汽车发展有限公司,未经昶洧新能源汽车发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611242191.8/2.html,转载请声明来源钻瓜专利网。





