[发明专利]一种人体语音识别传输方法及系统在审
| 申请号: | 201810099028.3 | 申请日: | 2018-01-31 |
| 公开(公告)号: | CN108417203A | 公开(公告)日: | 2018-08-17 |
| 发明(设计)人: | 郑英 | 申请(专利权)人: | 广东聚晨知识产权代理有限公司 |
| 主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/06;G10L15/22 |
| 代理公司: | 佛山市智汇聚晨专利代理有限公司 44409 | 代理人: | 张艳梅 |
| 地址: | 528000 广东省佛山市禅城区季*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音识别 语音数据 传输方法及系统 发音方式 用户人体 语音指令 特征点 预处理 语音识别技术 调整参数 语音 采集 传输 | ||
本发明公开了一种人体语音识别传输方法及系统,属于语音识别技术领域,所述方法包括:采集用户人体的语音数据;预处理所述语音数据;提取所述语音数据的特征点;选择对应于提取的所述特征点的发音方式模型;通过使用所选择的发音方式模型来调整参数,所述参数是用于识别语音指令的基准;基于调整的所述参数来识别所述用户人体的所述语音指令。利用本发明实施例,能够实现人体语音的识别跟传输,提高语音识别性能。
技术领域
本发明涉及语音识别技术领域,尤其涉及一种人体语音识别传输方法及系统。
背景技术
人机接口 (HMI) 使用户通过视觉、听觉、或触觉与机器进行交流。为了最小化驾驶员的注意力转移并且提高便利性,已尝试使用语音识别作为车辆内的HMI。根据常规的人体语音识别传输系统,使用标准语言的各种用户人体的声音被存储为语音数据,并且使用该语音数据来执行语音识别。然而,在这种系统中,难以保证语音识别性能,这是因为使用语音识别功能的用户人体的发音方式例如发音语调、发音速度、以及方言等通常不同于对应于语音数据的发音方式。
发明内容
本发明提供了一种人体语音识别传输方法及系统,具有以下优点:基于针对每个区域的语音数据生成针对每个区域的发音方式模型;选择对应于提取的特征点的发音方式模型;以及调整参数,该参数是用于识别语音识别指令的基准。
为达到上述目的,本发明公开了一种人体语音识别传输方法,所述方法包括:
采集用户人体的语音数据;
预处理所述语音数据;
提取所述语音数据的特征点;
选择对应于提取的所述特征点的发音方式模型;
通过使用所选择的发音方式模型来调整参数,所述参数是用于识别语音指令的基准;
基于调整的所述参数来识别所述用户人体的所述语音指令。
可选的,所述预处理所述语音数据的步骤包括:
将模拟语音数据转换为数字语音数据;
校正所述语音数据的增益;
以及消除所述语音数据中的噪声。
可选的,所述发音方式模型由以下步骤生成:
提取在所述语音数据库中存储的针对每个区域的语音数据的特征点;
在特征点数据库中存储所提取的针对每个区域的语音数据的特征点;
通过学习在所述特征点数据库中存储的针对每个区域的语音数据的特征点的分布,来生成学习模型;
以及通过使用所述学习模型来生成针对每个区域的发音方式模型。
为达到上述目的,本发明还公开了一种人体语音识别传输系统,包括:
采集器,用于采集用户人体的语音数据;
发音方式分类器,用于提取所述用户人体的所述语音数据的特征点,并且选择对应于所述特征点的发音方式模型;
参数调整器,用于通过使用所选择的所述发音方式模型来调整参数,所述参数是用于识别语音指令的基准;
以及语音识别引擎,用于基于调整的所述参数来识别所述用户人体的所述语音指令。
可选的,还包括:预处理器,将从所述采集器传输的模拟语音数据转换为数字语音数据,校正所述语音数据的增益并且消除所述语音数据中的噪声。
可选的,所述发音方式分类器包括:
语音数据库,用于存储针对每个区域的语音数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东聚晨知识产权代理有限公司,未经广东聚晨知识产权代理有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810099028.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:语音识别方法及系统
- 下一篇:基于大数据的信息安全处理方法





