[发明专利]音频分离方法、装置、电子设备及计算机可读存储介质在审
申请号: | 201910678465.5 | 申请日: | 2019-07-25 |
公开(公告)号: | CN110473566A | 公开(公告)日: | 2019-11-19 |
发明(设计)人: | 高立志 | 申请(专利权)人: | 深圳壹账通智能科技有限公司 |
主分类号: | G10L21/0272 | 分类号: | G10L21/0272;G10L21/028;G10L21/0208;G10L15/26;G10L15/14;G10L15/02;G10L17/00;G10L17/04;G06N20/00 |
代理公司: | 44334 深圳市赛恩倍吉知识产权代理有限公司 | 代理人: | 陈敬华;刘丽华<国际申请>=<国际公布> |
地址: | 518052 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种音频分离方法、装置、电子设备及计算机可读存储介质。所述方法包括:获取语音;对所述语音进行噪声过滤;从过滤后的语音中提取声纹特征数据,将所述声纹特征数据输入到预设语音分类模型进行分类得到分类结果,根据所述分类结果将相同的声纹特征数据对应的语音进行编码并存储为单独的语音文件而将所述语音进行分离处理;及对经过分离处理后的语音进行识别以获取所述语音的识别文本。本发明通过利用预设语音分类模型对过滤后的语音按照语音的声纹特征做分离处理,及对经过分离处理后的语音进行识别以获取所述语音的识别文本,可以识别出语音中不同人说的话语的语音文本,提高了语音识别的准确率。 | ||
搜索关键词: | 语音 分离处理 声纹特征 分类结果 语音分类 预设 过滤 计算机可读存储介质 文本 电子设备 数据对应 语音识别 语音文本 语音文件 噪声过滤 准确率 存储 分类 | ||
【主权项】:
1.一种音频分离方法,其特征在于,所述方法包括:/n获取语音;/n对所述语音进行噪声过滤;/n从过滤后的语音中提取声纹特征数据,将所述声纹特征数据输入到预设语音分类模型进行分类得到分类结果,根据所述分类结果将相同的声纹特征数据对应的语音进行编码并存储为单独的语音文件而将所述语音进行分离处理;及/n对经过分离处理后的语音进行识别以获取所述语音的识别文本。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳壹账通智能科技有限公司,未经深圳壹账通智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910678465.5/,转载请声明来源钻瓜专利网。