[发明专利]声音分析装置以及声音分析方法无效
| 申请号: | 200980111434.6 | 申请日: | 2009-09-17 |
| 公开(公告)号: | CN101981612A | 公开(公告)日: | 2011-02-23 |
| 发明(设计)人: | 广濑良文;釜井孝浩 | 申请(专利权)人: | 松下电器产业株式会社 |
| 主分类号: | G10L11/00 | 分类号: | G10L11/00;G10L11/04 |
| 代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 黄剑锋 |
| 地址: | 日本*** | 国省代码: | 日本;JP |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 声音 分析 装置 以及 方法 | ||
技术领域
本发明涉及通过分析输入声音,从而提取声道特征和声源特征的声音分析装置以及声音分析方法。
背景技术
近几年,随着声音合成技术的发展,已经能够创作出音质非常高的合成音。
然而,以往的合成音是以播音员的语调宣读新闻的语句等单一的用途为主。
另一方面,在移动电话的服务等方面所提供的服务中逐渐普及的是某种特殊的声音(具有个人再现性的高合成音或,具有高中女学生的语气或关西方言等特殊韵律或声质的合成音),融汇了一个内容之中,例如,以有名人物的声音消息来代替电铃声等。如上所述,为了增加个人间的交流中的乐趣,对于创作特殊的声音给对方听这样的需求也会增加。
然而,作为合成声音的方法,大致有以下两种方法。第一个方法为波形连接型声音合成方法,该波形连接型声音合成方法为从预先准备的声音单元DB(数据库)中选择适合的声音单元,并且,将选择的声音单元进行连接,从而合成声音的方法。第二个方法为分析合成型声音合成方法,该分析合成型声音合成方法为对声音进行参数分析,并且,根据分析后的声音参数,合成声音的方法。
若考虑对合成音的声质进行各种变化,则所述的波形连接型声音合成方法中,需要将声音单元DB仅准备必要的声质的种类,且需要在切换声音单元DB的同时连接声音单元。因此,为了创作各种声质的合成音,需要庞大的成本。
另一方面,在分析合成型声音合成方法中,使分析后的声音参数发生变形,从而能够对合成音的声质进行转换。通常,在参数分析中使用被称作声源声道模型的模型。
但是,在实际环境下,输入声音时可能掺进各种噪声。因此,需要对掺进的噪声采取对策。例如作为噪音抑制方法,存在专利文献1中所记载的技术。
图11是专利文献1中记载的噪音抑制方法的构成图。
专利文献1中记载的噪音抑制方法中,对于被推定为帧内的不包含声音成分(或者声音成分少)的频带设定比各个噪声帧的频带的增益值小的增益值,所述帧为被判断为声音帧的帧,并且,通过突出声音帧内的包含声音成分的频带,从而得到良好的听感效果。
也就是说,在对输入信号进行噪音的抑制处理的噪音抑制方法中,包括:声音帧判断步骤,判断帧为噪声帧还是声音帧;不同频带的增益决定步骤,根据所述声音帧判断步骤的结果,设定各个帧的不同频带的增益值;以及信号生成步骤,利用在不同频带的增益决定步骤中决定的不同频带的增益值对每个频带进行噪音抑制后对帧进行重组,从而生成被抑制了噪音的输出信号,所述噪音的抑制处理是将输入信号划分为预先规定的时间单位的帧,将该划分的帧划分为规定的频率频带,并且,按照每个该划分后的频带进行的处理。在所述不同频带的增益决定步骤中设定不同频带的增益值,以使在判断决定对象的帧为声音帧的情况下的不同频带的增益值能够小于在判断决定对象的帧为噪声帧的情况下的不同频带的增益值。
[专利文献1]日本国特开2002-169599号公报(第3-4页、图2)
专利文献1中记载的噪音抑制方法通过调节每个频带的增益,从而能够在视听感上抑制噪声的影响。但是,由于调节每个频带的增益,会导致发生声音的频谱结构的变形,因此,出现声音的个人特征发生变形的课题。
此外,也会出现在掺进噪声的突发的情况下,专利文献1中记载的方法不能完全抑制噪声的影响的课题。
发明内容
为了解决上述课题,本发明的目的在于提供一种声音分析装置,即使在如像实际环境那样存在背景噪声的情况下,也能够高精确度地分析声音。
在对声道以及声源进行模型化而得到的声道声源模型中,以往是假定为稳定的声源模型。因此,结果是以声道特征的细微变动作为正确的分析结果而被处理。发明人认为声道为稳定这样的假设比声源为稳定这样的假设更具有妥当性,并且,声源比声道变动得更快。基于这种思考,以往的声道声源模型提取根据声音所持有的波动或分析窗的位置而引起的时间变化,以作为声道特征。这样出现的问题是,声道本不具有的快速变化被作为了声道特征,而声源本身具有的快速变化却被从声源特征中除去。
发明人在专利文献的专利第4294724号公报上公开了解除由此细微变动而产生的影响的方法。也就是说,利用声道稳定这一特征,即使在输入声音内掺进噪声的情况下,也能够消除噪声的影响。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于松下电器产业株式会社,未经松下电器产业株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200980111434.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种生物质成型燃料棒及生产工艺
- 下一篇:过氧化氢低温等离子体灭菌机





