[发明专利]分析音频文件的语音特征的方法和装置在审
| 申请号: | 201310652731.X | 申请日: | 2013-12-05 |
| 公开(公告)号: | CN104700831A | 公开(公告)日: | 2015-06-10 |
| 发明(设计)人: | 施琴;张世磊;刘文;秦勇 | 申请(专利权)人: | 国际商业机器公司 |
| 主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L25/51 |
| 代理公司: | 北京市中咨律师事务所 11247 | 代理人: | 周良玉;于静 |
| 地址: | 美国*** | 国省代码: | 美国;US |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 分析 音频文件 语音 特征 方法 装置 | ||
1.一种分析音频文件的语音特征的方法,包括:
采用多种声学模型对所述音频文件中的语音内容进行语音识别,以获得多个识别结果;
对比所述多个识别结果以获得对比结果;
基于对比结果确定所述音频文件的语音声学特征。
2.根据权利要求1的方法,其中:
采用多种声学模型对所述音频文件的语音内容进行语音识别包括,采用与讲话者无关的SI声学模型和与讲话者有关的SD声学模型分别对所述音频文件中的语音内容进行语音识别,以分别获得SI识别结果和SD识别结果;
对比所述多个识别结果以获得对比结果包括,获得所述SI识别结果和SD识别结果之间的识别差异;
所述基于对比结果确定所述音频文件的语音声学特征包括,基于上述识别差异,确定所述音频文件的语音标准度。
3.根据权利要求2的方法,其中分别获得SI识别结果和SD识别结果包括:采用SI声学模型对所述音频文件的语音内容进行语音识别,以获得SI识别结果;基于所述音频文件中的语音内容对SI声学模型进行调整,从而获得SD声学模型;采用获得的SD声学模型对所述音频文件的语音内容进行语音识别,以获得SD识别结果。
4.根据权利要求1的方法,其中所述多种声学模型包括多种方言模型;所述对比结果示出基于多种方言模型获得的识别结果之间的准确度对比;所述基于对比结果确定所述音频文件的语音声学特征包括,基于上述准确度对比,确定所述音频文件中语音内容的方言特征。
5.根据权利要求1的方法,还包括,基于所述多个识别结果的至少一部分,确定所述音频文件中语音的语速。
6.根据权利要求1的方法,还包括,基于所述音频文件的信噪比,确定其背景噪声水平。
7.根据权利要求1的方法,还包括,基于所述音频文件的文件属性,确定其录音条件。
8.根据权利要求1的方法,还包括:
获取与所述音频文件中的语音内容相对应的文本;
基于所述文本,确定所述音频文件的语音内容特征。
9.根据权利要求8的方法,其中确定所述音频文件的语音内容特征包括:
确定文本中单词的类别和各类别单词的分布;
基于上述分布,确定所述音频文件的词汇类别。
10.根据权利要求8的方法,其中确定所述音频文件的语音内容特征包括:
采用多种n元语言模型分析所述文本中的单词组合;
基于对单词组合的分析,确定所述音频文件中语音内容的句法级别。
11.一种为用户推荐音频文件的方法,包括:
确定用户适合的语音特征;
获取多个音频文件各自的语音特征,所述多个音频文件各自的语音特征通过利用权利要求1-10之一的方法对所述多个音频文件进行分析而确定;
将语音特征与所述用户适合的语音特征相匹配的音频文件推荐给所述用户。
12.一种用于分析音频文件的语音特征的装置,包括:
语音识别单元,配置为采用多种声学模型对所述音频文件中的语音内容进行语音识别,以获得多个识别结果;
结果对比单元,配置为对比所述多个识别结果以获得对比结果;
声学特征确定单元,配置为基于对比结果确定所述音频文件的语音声学特征。
13.根据权利要求12的装置,其中:
所述语音识别单元配置为,采用与讲话者无关的SI声学模型和与讲话者有关的SD声学模型分别对所述音频文件中的语音内容进行语音识别,以分别获得SI识别结果和SD识别结果;
所述结果对比单元配置为,获取所述SI识别结果和SD识别结果之间的识别差异;
所述声学特征确定单元配置为,基于上述识别差异,确定所述音频文件的语音标准度。
14.根据权利要求13的装置,其中所述语音识别单元进一步配置为:采用SI声学模型对所述音频文件中的语音内容进行语音识别,以获得SI识别结果;基于所述音频文件中的语音内容对SI声学模型进行调整,从而获得SD声学模型;采用获得的SD声学模型对所述音频文件中的语音内容进行语音识别,以获得SD识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司;,未经国际商业机器公司;许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310652731.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:动态可调节的流体动力轴承刚度
- 下一篇:一种旋转模孔的笛子





