[发明专利]基于DNN的说话人无关单通道录音分离的方法和系统在审

申请号：	201810576208.6	申请日：	2018-06-06
公开（公告）号：	CN109036454A	公开（公告）日：	2018-12-18
发明（设计）人：	徐海青;赵永生;吴立刚;章爱武;陈是同;徐唯耀;秦浩;王文清;郑娟;秦婷;梁翀;浦正国;张天奇;余江斌;韩涛;杨维;张才俊;孙林檀;田诺;潘子春;李葵;李明;张引强;黄影	申请（专利权）人：	安徽继远软件有限公司;国网信息通信产业集团有限公司;国网安徽省电力有限公司信息通信分公司;国家电网有限公司
主分类号：	G10L21/0272	分类号：	G10L21/0272;G10L25/21;G10L25/27;G10L25/30;G06N3/04;G06K9/62
代理公司：	合肥维可专利代理事务所(普通合伙) 34135	代理人：	吴明华
地址：	230088 安徽***	国省代码：	安徽;34
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种基于DNN的说话人无关单通道录音分离的方法和系统，属于技术领域，具体步骤包括对训练集的语料进行分词处理，同时对词语进行向量编码，通过分词处理和词语向量编码的过程，用矩阵将一段语句表示出来生成词向量，然后将生成的词向量作为输入样本，输入到卷积神经网络中。本发明提出的组合优化算法在对文本情感特征的自动学习上有着不错的效果，模型的训练速度也大大的提高，分类结果准确度高、自动学习能力强。
搜索关键词：	分词处理自动学习词向量单通道录音矩阵卷积神经网络组合优化算法准确度词语向量分类结果输入样本文本情感向量编码能力强训练集语料语句词语
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.基于DNN的说话人无关单通道录音分离的方法，其特征在于：具体步骤为：S1:从数据库中提取录音数据，得到训练集和测试集；S2:对训练集进行单通道说话人混合特征提取；S3:通过录音对数功率谱特征训练聚类模型对说话人混合特征类聚，将男性和女性声音分为四个子类，提取特征；S4:将提取的特征送入说话人DNN检测器，检测判断选择对应的DNN分离器；S5:DNN分离器基于说话人相关的方式进行单通道录音分离训练，实现话者分离，得到目标信号的特征向量，DNN分离器输出目标语音的对数功率谱特征；S6:对DNN分离器输出目标语音的对数功率谱特征进行波形重建，产生可测听的语音信号。S7：测试集对产生的可测听的语音信号结果进行测试。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于安徽继远软件有限公司;国网信息通信产业集团有限公司;国网安徽省电力有限公司信息通信分公司;国家电网有限公司，未经安徽继远软件有限公司;国网信息通信产业集团有限公司;国网安徽省电力有限公司信息通信分公司;国家电网有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201810576208.6/，转载请声明来源钻瓜专利网。

上一篇：一种判定设备噪声品质的方法及装置
下一篇：直达声与背景声提取方法、扬声器系统及其声重放方法

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L21-00 为了改变语音信号的质量或其可识度而处理语音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号
G10L21-02 .语音增强，例如降低噪声或消除回声
G10L21-04 .时间压缩或扩展
G10L21-06 .将语音转换成非可听表达形式，例如语音可视化、触觉辅助的语音处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于DNN的说话人无关单通道录音分离的方法和系统在审

专利文献下载