[发明专利]分析音频文件的语音特征的方法和装置在审
| 申请号: | 201310652731.X | 申请日: | 2013-12-05 |
| 公开(公告)号: | CN104700831A | 公开(公告)日: | 2015-06-10 |
| 发明(设计)人: | 施琴;张世磊;刘文;秦勇 | 申请(专利权)人: | 国际商业机器公司 |
| 主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L25/51 |
| 代理公司: | 北京市中咨律师事务所 11247 | 代理人: | 周良玉;于静 |
| 地址: | 美国*** | 国省代码: | 美国;US |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 分析 音频文件 语音 特征 方法 装置 | ||
技术领域
本发明涉及音频分析和处理,更具体而言,涉及分析音频文件的语音特征的方法和装置。
背景技术
现有技术中已经提出多种方法来分析各类应用对象。例如,搜索引擎可以捕获网站内容,并通过提取关键词等方式分析网站内容,还可以根据关键词或其他分析结果为网站打上标签。一些图片处理工具可以对图片进行分析,例如比对两个图片的相似性,进而进行模糊匹配等。然而,对于音频文件,特别是主要包含语音内容的音频文件,现有技术并没有有效的方法对其进行内容和特征的分析。而另一方面,在许多情况下,希望获得关于音频文件的特征信息,从而可以对音频文件进行分类、匹配、推荐等进一步操作。
在一个典型例子中,外语学习者获得了一些外语内容的音频文件,以期进行听力练习。然而,由于现有技术并没有有效的音频分析方法,学习者只能根据音频文件的标题、来源(来源于新闻播报、电影片段或是专用听力材料)等信息来选择音频文件,并且只能在听过该音频文件之后才能判断所选择的音频文件是否符合自己的听力水平。这显然浪费了大量的时间和精力。
在另一例子中,提供音频文件的资料库期望对音频文件进行分类或分级,以便于进行管理或向用户推荐音频文件。然而,在无法对音频文件进行有效分析的情况下,资料库只能根据该音频文件的文件大小、作者等属性信息进行分类,无法基于更加本质的与音频有关的特征进行分类。
因此,希望提出新的方案,能够有效地对音频文件的语音特征进行分析。
发明内容
考虑到现有技术中的不足,本发明提出一种方案,旨在对音频文件的语音特征进行分析。
根据本发明的一个方面,提供了一种分析音频文件的语音特征的方法,包括:采用多种声学模型对所述音频文件中的语音内容进行语音识别,以获得多个识别结果;对比所述多个识别结果以获得对比结果;基于对比结果确定所述音频文件的语音声学特征。
根据本发明另一方面,提供了一种为用户推荐音频文件的方法,包括:确定用户适合的语音特征;获取多个音频文件各自的语音特征,所述多个音频文件各自的语音特征通过利用前述方面的方法对所述多个音频文件进行分析而确定;将语音特征与所述用户适合的语音特征相匹配的音频文件推荐给所述用户。
根据本发明另一方面,提供了一种用于分析音频文件的语音特征的装置,包括:语音识别单元,配置为采用多种声学模型对所述音频文件中的语音内容进行语音识别,以获得多个识别结果;结果对比单元,配置为对比所述多个识别结果以获得对比结果;声学特征确定单元,配置为基于对比结果确定所述音频文件的语音声学特征。
根据本发明又一方面,提供了一种为用户推荐音频文件的装置,包括:用户特征确定单元,配置为确定用户适合的语音特征;文件特征获取单元,配置为获取多个音频文件各自的语音特征,所述多个音频文件各自的语音特征通过利用前述方面的装置对所述多个音频文件进行分析而确定;匹配单元,配置为将语音特征与所述用户适合的语音特征相匹配的音频文件推荐给所述用户。
利用本发明实施例的方法和装置,可以对音频文件进行语音分析,从而为用户提供关于音频文件中语音内容特点的信息。基于这样的信息,还可以为用户推荐适合用户水平的音频文件。
附图说明
通过结合附图对本公开示例性实施方式进行更详细的描述,本公开的上述以及其它目的、特征和优势将变得更加明显,其中,在本公开示例性实施方式中,相同的参考标号通常代表相同部件。
图1示出了适于用来实现本发明实施方式的示例性计算机系统/服务器12的框图;
图2示出根据一个实施例的分析音频文件的方法的流程图;
图3A和3B示出根据本发明实施例的标记音频文件的例子;
图4示出根据一个实施例的推荐音频文件的方法的流程图;
图5示出根据本发明一个实施例的分析音频文件的语音特征的装置的示意框图;以及
图6示出根据本发明一个实施例的推荐音频文件的装置的示意框图。
具体实施方式
下面将参照附图更详细地描述本公开的优选实施方式。虽然附图中显示了本公开的优选实施方式,然而应该理解,可以以各种形式实现本公开而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司;,未经国际商业机器公司;许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310652731.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:动态可调节的流体动力轴承刚度
- 下一篇:一种旋转模孔的笛子





