[发明专利]基于大数据的信息安全处理方法在审
| 申请号: | 201810161884.7 | 申请日: | 2018-02-27 |
| 公开(公告)号: | CN108417204A | 公开(公告)日: | 2018-08-17 |
| 发明(设计)人: | 王兰鹰 | 申请(专利权)人: | 四川云淞源科技有限公司 |
| 主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/08;G10L19/16;G10L19/04;G10L19/032;G10L21/0224;G10L21/0232;G10L25/30;G10L25/45 |
| 代理公司: | 北京天奇智新知识产权代理有限公司 11340 | 代理人: | 杨春 |
| 地址: | 610041 四川省成都市高新区*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 信息安全处理 大数据 特征提取结果 原始语音数据 特征提取 语音数据 数据处理 抗噪性 准确率 语音 | ||
1.一种基于大数据的信息安全处理方法,其特征在于,包括:
获取原始语音数据,进行特征提取;
基于特征提取结果生成概要语音数据。
2.根据权利要求1所述的方法,其特征在于,所述特征提取进一步包括:
将语音切分为多个音频块,提取各帧音频的统计特征,形成相应的特征向量,其中每个音频块包含多个帧。
3.根据权利要求1所述的方法,其特征在于,进一步包括:
选取预定义数量的音频块为初始结果,并对其进行重建,获得初始语音库和重建系数;
根据下一音频块更新卷积神经网络参数,同时对该音频块进行重建并计算重建误差,
若误差大于设定阈值,则将该音频块加入概要语音库中并更新该库;
依次在线处理新的音频块直到结束,更新的概要语音数据即为最终生成的概要语音数据。
4.根据权利要求1所述的方法,其特征在于,所述形成特征向量的步骤进一步包括:
1)设原始语音均匀分为n个音频块,即每个音频块包含t帧音频,将各帧音频转换成统一码率并保持原始采样率;
2)提取各帧的局部特征,包括过零率、平均幅度差和LPC系数;
3)顺序组合各帧的上述音频特征,形成维度为nf的特征向量。
5.根据权利要求4所述的方法,其特征在于,模拟语音信号s(n)的LPC系数最大值表示为:
LPC系数Rw(k):
式中,sw(n)为加窗语音;N为有效语音块长;k为延迟量;
对sw(n)取最大值,即可得到LPC系数最大值;
模拟语音信号s(n)的平均幅度差Ω由下式给出:
式中,N为帧长;S(k)为s(n)的FFT变换;E为模拟语音信号频域幅度的均值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川云淞源科技有限公司,未经四川云淞源科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810161884.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种人体语音识别传输方法及系统
- 下一篇:语义理解训练方法和系统





