[发明专利]音频信号处理方法、装置、电子设备及存储介质有效
申请号: | 201910955139.4 | 申请日: | 2019-10-09 |
公开(公告)号: | CN110675886B | 公开(公告)日: | 2023-09-15 |
发明(设计)人: | 朱睿;黄俊;王燕南 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G10L21/013 | 分类号: | G10L21/013;G10L25/03;G10L25/24;G10L25/30;G10H1/36 |
代理公司: | 北京市立方律师事务所 11330 | 代理人: | 张筱宁 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 信号 处理 方法 装置 电子设备 存储 介质 | ||
1.一种音频信号处理方法,其特征在于,所述方法包括:
获取用户所录制的待处理音频信号;
提取所述待处理音频信号的音频特征,所述待处理音频信号包括背景音频信号和待处理声音信号;
获取与所述待处理音频信号对应的原声音频信号的标准音频特征,所述原声音频信号包括原声声音信号和所述背景音频信号;
基于所述待处理音频信号的音频特征和所述标准音频特征,对所述待处理音频信号进行修正处理,得到修正后的音频信号;
其中,所述待处理音频信号的音频特征包括所述待处理声音信号的语音特征,所述标准音频特征包括所述原声声音信号的标准语音特征和标准节奏特征;所述基于所述待处理音频信号的音频特征和所述标准音频特征,对所述待处理音频信号进行修正处理,包括:
根据所述标准语音特征、标准节奏特征和所述待处理声音信号的语音特征,确定所述待处理音频信号的节奏修正参数;
根据所述节奏修正参数,对所述待处理音频信号进行节奏修正处理。
2.根据权利要求1所述的方法,其特征在于,所述标准节奏特征包括所述原声音频信号所对应的文字的标准字节奏特征和标准句子节奏特征,所述节奏修正参数包括句子节奏对齐参数和字节奏对齐参数;
所述根据所述标准语音特征、标准节奏特征和所述待处理音频信号的语音特征,确定所述待处理音频信号的节奏修正参数,包括:
基于所述标准语音特征、所述标准句子节奏特征和所述待处理声音信号的语音特征,得到所述待处理音频信号的句子节奏特征、以及句子节奏对齐参数;
基于所述待处理音频信号的句子节奏特征、所述标准句子节奏特征和标准字节奏特征,得到所述待处理音频信号的字节奏特征;
基于所述待处理音频信号的字节奏特征和所述标准字节奏特征,得到字节奏对齐参数。
3.根据权利要求2所述的方法,其特征在于,所述标准字节奏特征包括所述原声音频信号所对应的文字中的每个字对应的开始时间戳和结束时间戳;
所述标准句子节奏特征包括所述原声音频信号所对应的文字中的每个句子对应的开始时间戳和结束时间戳;
所述待处理音频信号的字节奏特征包括所述待处理音频信号所对应的文字中的每个字对应的开始时间戳和结束时间戳;
所述待处理音频信号的句子节奏特征包括所述待处理音频信号所对应的文字中的每个句子对应的开始时间戳和结束时间戳。
4.根据权利要求1所述的方法,其特征在于,所述标准语音特征包括标准初始语音特征和标准音素瓶颈特征,所述待处理声音信号的语音特征包括初始语音特征和音素瓶颈特征;
所述标准语音特征是通过以下方式得到的:
提取所述原声声音信号的标准初始语音特征;
基于所述标准初始语音特征,提取所述原声声音信号的标准音素瓶颈特征;
所述待处理声音信号的音频特征是通过以下方式得到的:
提取所述待处理声音信号的初始语音特征;
基于所述初始语音特征,提取所述待处理声音信号的音素瓶颈特征。
5.根据权利要求4所述的方法,其特征在于,所述标准节奏特征包括所述原声音频信号所对应的文字的标准字节奏特征和标准句子节奏特征;
所述根据所述标准语音特征、标准节奏特征和所述待处理声音信号的语音特征,确定所述待处理音频信号的节奏修正参数,包括:
基于所述标准音素瓶颈特征、所述标准句子节奏特征和所述待处理声音信号的音素瓶颈特征,得到所述待处理音频信号的句子节奏特征、以及句子节奏对齐参数;
基于所述待处理音频信号的句子节奏特征、所述标准句子节奏特征、所述标准初始语音特征、所述初始语音特征和所述标准字节奏特征,得到所述待处理音频信号的字节奏特征;
基于所述待处理音频信号的字节奏特征和所述标准字节奏特征,得到字节奏对齐参数。
6.根据权利要求1所述的方法,其特征在于,所述节奏修正参数包括句子节奏对齐参数和字节奏对齐参数;
所述根据所述节奏修正参数,对所述待处理音频信号进行节奏修正处理,包括:
根据所述句子节奏对齐参数和字节奏对齐参数,将所述待处理音频信号和所述原声音频信号分别进行句子节奏对齐和字节奏对齐。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910955139.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:混音方法、装置及存储介质
- 下一篇:一种用于会议系统的多麦克风切换方法和系统