[发明专利]音频信号的对齐方法和装置有效
申请号: | 201811641809.7 | 申请日: | 2018-12-29 |
公开(公告)号: | CN111383658B | 公开(公告)日: | 2023-06-09 |
发明(设计)人: | 李敬 | 申请(专利权)人: | 广州市百果园信息技术有限公司 |
主分类号: | G10L25/24 | 分类号: | G10L25/24;G10L25/51;G10L25/90 |
代理公司: | 北京市立方律师事务所 11330 | 代理人: | 刘延喜 |
地址: | 511442 广东省广州市番禺区南村*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 信号 对齐 方法 装置 | ||
本发明涉及语音处理技术领域,本发明提供一种音频信号的对齐方法和装置,所述方法包括对待对齐的第一音频信号和第二音频信号的帧信号进行初始匹配对齐;计算所述第一音频信号和第二音频信号的帧信号之间的相似度;根据所述相似度确定所述第一音频信号和第二音频信号中帧信号不匹配的位置;从所述位置后的一段语音对应的音频信号间隔开始,对所述第一音频信号和第二音频信号的帧信号重新进行匹配对齐。本发明降低了因两段音频信号存在不匹配的音频片段而对整段音频信号对齐的影响。
技术领域
本发明涉及语音处理技术领域,具体而言,本发明涉及一种音频信号的对齐方法和装置。
背景技术
随着多媒体的多元化发展,对音频的编辑手段层出不穷,其中,语音模仿受到了用户的欢迎。因此,实现语音模仿的音频对齐技术也得到了广泛的应用。
但传统的音频对齐技术对于存在较多不同音频片段的两段音频信号,如其中一段音频信号增加一段音频片段信号、或者该两段音频信号完全不同的情况,得到对齐效果比较差,同时也会对后续的音频信号的对齐匹配造成影响。
发明内容
为克服以上技术问题,特别是现有技术中因存在不匹配音频片段信号而导致对齐效果差的问题,特提出以下技术方案:
第一方面,本发明提供一种音频信号的对齐方法,包括如下步骤:
对待对齐的第一音频信号和第二音频信号的帧信号进行初始匹配对齐;
计算所述第一音频信号和第二音频信号的帧信号之间的相似度;
根据所述相似度确定所述第一音频信号和第二音频信号中帧信号不匹配的位置;
从所述位置后的一段语音对应的音频信号间隔开始,对所述第一音频信号和第二音频信号的帧信号重新进行匹配对齐。
在其中一个实施例中,所述对待对齐的第一音频信号和第二音频信号的帧信号进行初始匹配对齐的步骤包括:
对待对齐的第一音频信号和第二音频信号的帧信号进行分帧,并计算每帧的MFCC系数;
利用DTW算法对第一音频信号和第二音频信号的帧信号进行匹配对齐,获得第一音频信号和第二音频信号的帧信号之间的帧对应关系。
在其中一个实施例中,所述计算所述第一音频信号和第二音频信号的帧信号之间的相似度的步骤,包括:
获取所述第一音频信号和所述第二音频信号的信号长度,并计算得到所述第一音频信号和所述第二音频信号之间的信号长度的第一比例系数;
对所述第一音频信号中以每帧开始获取设定帧长度的第一音频片段信号,将所述第一音频片段信号对应匹配至所述第二音频信号中的对应的第二音频片段信号,并计算得到所述第一音频片段信号和所述第二音频片段信号的信号长度的第二比例系数;
若所述第一比例系数与所述第二比例系数的比例符合对应音频类型的经验比例值时,所述第一音频片段信号和所述第二音频片段信号符合帧信号之间的相似度要求。
在其中一个实施例中,所述计算得到所述第一音频信号和所述第二音频信号之间的信号长度的第一比例系数的公式为:
其中,Total A和Total B分别为所述第一音频信号和所述第二音频信息的信号长度。
在其中一个实施例中,所述计算得到所述第一音频片段信号和所述第二音频片段信号的信号长度的第二比例系数的公式为:
其中,i=1:Na-La
start=Map12(i)·x
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州市百果园信息技术有限公司,未经广州市百果园信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811641809.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种控制电路和控制方法
- 下一篇:一种舞台用聚光LED照明装置