[发明专利]一种语音数据的扩充方法、系统、电子设备及存储介质在审

专利信息
申请号: 202011369921.7 申请日: 2020-11-30
公开(公告)号: CN112530399A 公开(公告)日: 2021-03-19
发明(设计)人: 金炎驰;梁志婷;韩振龙 申请(专利权)人: 上海明略人工智能(集团)有限公司
主分类号: G10L13/02 分类号: G10L13/02
代理公司: 青岛清泰联信知识产权代理有限公司 37256 代理人: 李红岩
地址: 200030 上海市徐汇区*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 语音 数据 扩充 方法 系统 电子设备 存储 介质
【说明书】:

发明提出一种语音数据的扩充方法、系统、电子设备及存储介质,其方法技术方案包括对话设计步骤,根据一预设场景设计文本形式的对话内容;文本转化步骤,将所述对话内容转化为对话语音;音频混合步骤,将所述对话语音与所述预设场景下的噪音混合,得到模拟音频数据并输出。本发明解决了现有语音数据的扩充方法复杂且可靠性不强的问题。

技术领域

本发明属于语言处理领域,尤其涉及一种可适用于语音识别技术的语音数 据的扩充方法、系统、电子设备及存储介质。

背景技术

随着信息技术的发展,互联网的普及,实现人机之间人性化、智能化的有 效交互,构建高效自然的人机交流环境,已经成为当前信息技术应用和发展的 迫切需求。

近二十年来,语音识别技术取得显著进步,开始从实验室走向市场。随着 语音识别技术的飞速发展,语音输入、语音扩充、语音识别、语音判断、语音 播放、语音调速等各种在线语音识别受到了越来越多的关注,人们预计,未来 10年内,语音识别技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、 消费电子产品等各个领域。语音识别听写机在一些领域的应用被美国新闻界评 为1997年计算机发展十件大事之一。很多专家都认为语音识别技术是2000年 至2010年间信息技术领域十大重要的科技发展技术之一。语音识别技术所涉及 的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、 人工智能等等。

目前在进行对音频的处理时往往需要进行训练,在训练时往往需要增加不 同于说话人的语音当做干扰项或对单独说话人的不同特征来当做干扰项进行训 练,目前最常用的技术是将未经修改的音频直接作为训练数据,或者将音频分 割成多段的语音,便于进行语音中的特征提取生成语音特征,再通过多个语音 特征拼接成新音频,但是这样的音频不具有很高的干扰性,需要本身存在原始 音频,且原始音频的切分重组会导致音频丢失时序信息,以及环境信息和本身 的情感信息和内容信息等。

发明内容

本申请实施例提供了一种语音数据的扩充方法、系统、电子设备及存储介 质,以至少解决现有语音数据的扩充方法复杂且可靠性不强的问题。

第一方面,本申请实施例提供了一种语音数据的扩充方法,包括:对话设 计步骤,根据一预设场景设计文本形式的对话内容;文本转化步骤,将所述对 话内容转化为对话语音;音频混合步骤,将所述对话语音与所述预设场景下的 噪音混合,得到模拟音频数据并输出。

优选的,所述对话设计步骤还包括:根据一预设场景,获取所述预设场景 下的文本数据,通过获取的所述文本数据设计对话内容。

优选的,所述文本转化步骤还包括:将所述对话内容通过一TTS系统转 化为对话语音。

优选的,所述音频混合步骤包括:在一真实场景中播放所述对话语音,并 同时采集所述真实场景下的真实噪音数据与所述对话语音。

优选的,所述音频混合步骤包括:获取现有的所述预设场景下的模拟噪音 数据,并将所述对话语音直接与所述模拟噪音数据直接混合。

第二方面,本申请实施例提供了一种语音数据的扩充系统,适用于上述一 种语音数据的扩充方法,包括:对话设计单元,根据一预设场景,获取所述预 设场景下的文本数据,通过获取的所述文本数据设计对话内容;文本转化单元, 将所述对话内容通过一TTS系统转化为对话语音;音频混合单元,将所述对话 语音与所述预设场景下的噪音混合,得到模拟音频数据并输出。

在其中一些实施例中,所述音频混合单元包括:在一真实场景中播放所述 对话语音,并同时采集所述真实场景下的真实噪音数据与所述对话语音。

在其中一些实施例中,所述模型建立模块还包括:所述音频混合单元包括: 获取现有的所述预设场景下的模拟噪音数据,并将所述对话语音直接与所述模 拟噪音数据直接混合。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海明略人工智能(集团)有限公司,未经上海明略人工智能(集团)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011369921.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top