[发明专利]基于DNN的说话人无关单通道录音分离的方法和系统在审
| 申请号: | 201810576208.6 | 申请日: | 2018-06-06 |
| 公开(公告)号: | CN109036454A | 公开(公告)日: | 2018-12-18 |
| 发明(设计)人: | 徐海青;赵永生;吴立刚;章爱武;陈是同;徐唯耀;秦浩;王文清;郑娟;秦婷;梁翀;浦正国;张天奇;余江斌;韩涛;杨维;张才俊;孙林檀;田诺;潘子春;李葵;李明;张引强;黄影 | 申请(专利权)人: | 安徽继远软件有限公司;国网信息通信产业集团有限公司;国网安徽省电力有限公司信息通信分公司;国家电网有限公司 |
| 主分类号: | G10L21/0272 | 分类号: | G10L21/0272;G10L25/21;G10L25/27;G10L25/30;G06N3/04;G06K9/62 |
| 代理公司: | 合肥维可专利代理事务所(普通合伙) 34135 | 代理人: | 吴明华 |
| 地址: | 230088 安徽*** | 国省代码: | 安徽;34 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明公开了一种基于DNN的说话人无关单通道录音分离的方法和系统,属于技术领域,具体步骤包括对训练集的语料进行分词处理,同时对词语进行向量编码,通过分词处理和词语向量编码的过程,用矩阵将一段语句表示出来生成词向量,然后将生成的词向量作为输入样本,输入到卷积神经网络中。本发明提出的组合优化算法在对文本情感特征的自动学习上有着不错的效果,模型的训练速度也大大的提高,分类结果准确度高、自动学习能力强。 | ||
| 搜索关键词: | 分词处理 自动学习 词向量 单通道 录音 矩阵 卷积神经网络 组合优化算法 准确度 词语向量 分类结果 输入样本 文本情感 向量编码 能力强 训练集 语料 语句 词语 | ||
【主权项】:
1.基于DNN的说话人无关单通道录音分离的方法,其特征在于:具体步骤为:S1:从数据库中提取录音数据,得到训练集和测试集;S2:对训练集进行单通道说话人混合特征提取;S3:通过录音对数功率谱特征训练聚类模型对说话人混合特征类聚,将男性和女性声音分为四个子类,提取特征;S4:将提取的特征送入说话人DNN检测器,检测判断选择对应的DNN分离器;S5:DNN分离器基于说话人相关的方式进行单通道录音分离训练,实现话者分离,得到目标信号的特征向量,DNN分离器输出目标语音的对数功率谱特征;S6:对DNN分离器输出目标语音的对数功率谱特征进行波形重建,产生可测听的语音信号。S7:测试集对产生的可测听的语音信号结果进行测试。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽继远软件有限公司;国网信息通信产业集团有限公司;国网安徽省电力有限公司信息通信分公司;国家电网有限公司,未经安徽继远软件有限公司;国网信息通信产业集团有限公司;国网安徽省电力有限公司信息通信分公司;国家电网有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810576208.6/,转载请声明来源钻瓜专利网。





