[发明专利]语音信号分离方法、装置、计算机设备以及存储介质在审
| 申请号: | 201810802835.7 | 申请日: | 2018-07-20 |
| 公开(公告)号: | CN108962277A | 公开(公告)日: | 2018-12-07 |
| 发明(设计)人: | 张超钢 | 申请(专利权)人: | 广州酷狗计算机科技有限公司 |
| 主分类号: | G10L21/0272 | 分类号: | G10L21/0272;G10L21/0232;G10L25/45 |
| 代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 郭晶 |
| 地址: | 510660 广东省广州*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明公开了一种语音信号分离方法、装置、计算机设备以及存储介质,属于语音信号处理领域。所述方法包括:对待分离的音频文件的声波波形进行采样,得到音频信号;将音频信号从时域转换至频域,得到音频信号的频谱,频谱仅用于表示音频信号的振幅且振幅为实数;将音频信号的频谱进行分解,得到伴奏频谱与人声频谱;将伴奏频谱与人声频谱从频域转换至时域,得到伴奏音频与人声音频。本发明利用转换时仅用实数来表示音频帧的振幅的变换算法,来进行时域到频域以及频域到时域的变换,由于变换前后均不会对相位进行变换,相位信息不受损失,因此,基于这种转换方式从音频文件中分离伴奏和人声,避免傅里叶变换频谱分解的相位失真问题。 | ||
| 搜索关键词: | 频谱 音频信号 伴奏 频域 计算机设备 存储介质 音频文件 语音信号 实数 时域 语音信号处理 傅里叶变换 变换算法 频谱分解 频域转换 声波波形 时域转换 相位失真 相位信息 转换方式 音频帧 采样 分解 转换 | ||
【主权项】:
1.一种语音信号分离方法,其特征在于,所述方法包括:对待分离的音频文件的声波波形进行采样,得到音频信号;将所述音频信号从时域转换至频域,得到所述音频信号的频谱,所述频谱仅用于表示所述音频信号的振幅且所述振幅为实数;将所述音频信号的频谱进行分解,得到伴奏频谱与人声频谱;将所述伴奏频谱与人声频谱从频域转换至时域,得到伴奏音频与人声音频。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州酷狗计算机科技有限公司,未经广州酷狗计算机科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810802835.7/,转载请声明来源钻瓜专利网。





