[发明专利]一种语音识别系统及方法在审
申请号: | 201711216025.5 | 申请日: | 2017-11-28 |
公开(公告)号: | CN108053823A | 公开(公告)日: | 2018-05-18 |
发明(设计)人: | 吴砚峰 | 申请(专利权)人: | 广西职业技术学院 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/26;G06F17/30 |
代理公司: | 北京轻创知识产权代理有限公司 11212 | 代理人: | 杨立;付倩 |
地址: | 530226 广西*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 识别 系统 方法 | ||
本发明涉及一种语音识别系统及方法。该系统包括:语音采集模块、口音甄别模块、语音校正模块以及语音转换模块;语音采集模块,用于采集语音信息;口音甄别模块,用于根据语音信息识别语音信息语音发出者的口音所属的地域,并将识别结果输入至语音校正模块;语音校正模块,用于根据语音发出者的口音所属的地域对语音信息进行校正,并将校正后的结果输入至语音转换模块;语音转换模块,用于将校正后的语音信息转换为文字信息并输出。通过上述方法,可以实现语音转换文字之前,事先将地域方言语音转换为普通话语音后,再将语音转换为文字,大大提升了语音转换的准确率。
技术领域
本发明涉及语音识别领域,尤其涉及一种语音识别系统及方法。
背景技术
语音识别技术应用越来越广泛,但是现在的语音识别库基本都是基于普通话的语音而言,将语音转换为文字,准确率比较高。但是,现实生活中,大部分人的普通话都不标准,或多或少都携带一些地方语音。现有的语音识别系统将“方言”转换为文字的准确的较低,很多时候可能转换为令人哭笑不得的文字,甚至会给客户造成众多不便。
发明内容
为解决上述技术问题,本发明提供了一种语音识别系统及方法。
第一方面,本发明提供了一种语音识别系统,该系统包括语音采集模块、口音甄别模块、语音校正模块以及语音转换模块;
语音采集模块,用于采集语音信息;
口音甄别模块,用于根据语音信息识别语音信息语音发出者的口音所属的地域,并将识别结果输入至语音校正模块;
语音校正模块,用于根据语音发出者的口音所属的地域对语音信息进行校正,并将校正后的结果输入至语音转换模块;
语音转换模块,用于将校正后的语音信息转换为文字信息并输出。
本发明的有益效果是:语音采集模块采集到语音后,首先通过口音甄别模块甄别语音信息发出者的口音所属地域,然后根据该口音所属地域,采用与该地域的口音相应的校正方式对用户的口音进行校正,将其校正为普通话。最后将转换后的普通话语音转化为文字,语音转换为文字的正确率大大提高,提升用户体验度。
进一步,该系统还包括:处理模块,用于将语音采集模块采集的语音信息,与语音转换模块将校正后的语音信息进行转换后所获取的文字信息进行匹配并存储
采用上述进一步的方案的有益技术效果在于,将采集的语音和转换后的文字信息进行匹配并存储后,如果后续采集到同样的语音后,无需经过语音甄别和校正等后续步骤,直接读取与该语音匹配的文字信息并输出。节省工作流程,提升工作效率。
进一步,口音甄别模块包括:特征提取单元和匹配单元;
特征提取单元,用于提取语音信息中的语音特征;
匹配单元,用于根据语音特征在预设地域语音库中查找与语音特征匹配的语音所属地域信息。
采用上述进一步的技术方案的有益技术效果在于,事先提取语音信息中的语音特征,然后将语音特征和预设的地域语音库中的语音特征进行匹配,可以准确的确定语音信息发出者的口音所属的地域。
进一步的,语音校正模块包括第一语音编码模块、语音解码模块以及第二语音编码模块;
第一语音编码模块,用于根据语音信息发出者的口音所属地域确定第一语音编码格式;
根据第一语音编码格式编码语音信息,生成第一数据帧;
语音解码模块,用于对第一数据帧进行解码,产生性语音采样序列;
第二语音编码模块,用于获取与普通话对应的第二语音编码格式;
根据第二语音编码格式,将线性语音采样序列转换成普通话语音。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广西职业技术学院,未经广西职业技术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711216025.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种信息处理方法以及电子设备
- 下一篇:具有液压装置的秤