[发明专利]一种基于深度网络嵌入和识别音频水印的方法和装置在审
| 申请号: | 202111250867.9 | 申请日: | 2021-10-26 |
| 公开(公告)号: | CN113990330A | 公开(公告)日: | 2022-01-28 |
| 发明(设计)人: | 李平;蒋升 | 申请(专利权)人: | 随锐科技集团股份有限公司 |
| 主分类号: | G10L19/018 | 分类号: | G10L19/018;G10L25/30;G06N3/04;G06N3/08 |
| 代理公司: | 北京兴智翔达知识产权代理有限公司 11768 | 代理人: | 李琴 |
| 地址: | 100192 北京市海淀区宝*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 深度 网络 嵌入 识别 音频 水印 方法 装置 | ||
1.一种基于深度网络嵌入音频水印的方法,其特征在于,包括以下步骤:
S1:对原始音频进行分帧,并且对每个分帧进行加窗和短时傅里叶变换;
S2:将短时傅里叶变换后提取出来的频域特征作为U-net网络的输入,并且把水印信息嵌入到U-net网络中,进行编码;
S3:将编码后的频域特征进行短时傅里叶逆变换得到带水印的音频。
2.根据权利要求1所述的基于深度网络嵌入音频水印的方法,其特征在于,所述步骤S2中,U-net网络的上采样阶段与下采样阶段采用相同数量层次的卷积操作,且使用跨越连接的结构将下采样层与上采样层相连。
3.根据权利要求2所述的基于深度网络嵌入音频水印的方法,其特征在于,所述U-net的下采样部分由四块编码器组成,每块编码器是由2维卷积网络构成,用于批量归一化处理;频域特征经过4块编码器的映射之后,得到的维数减小到8*2*256;之后用四块编码器进行升采样操作,每块编码器是由2维卷积网络构成,用于批量归一化处理。
4.一种基于深度网络识别音频水印的方法,其特征在于,包括以下步骤:
S4:通过2维卷积网络对带水印的音频进行解码,得到水印信息,其中,解码过程包括:采用2维卷积网络,用于批量归一化处理。
5.根据权利要求4所述的基于深度网络识别音频水印的方法,其特征在于,所述步骤S4中,采用解码器进行解码;解码器能够输出32个0-1之间的预测概率值,并且通过解码器损失函数得到水印信息。
6.一种基于深度网络嵌入音频水印的装置,其特征在于,包括预处理模块、编码器和处理模块,
所述预处理模块用于对原始音频进行分帧,并且对每个分帧进行加窗和短时傅里叶变换;
所述编码器用于将短时傅里叶变换后提取出来的频域特征作为U-net网络的输入,并且将水印信息嵌入到U-net网络中,进行编码;
所述处理模块用于将编码后的频域特征进行短时傅里叶逆变换得到带水印的音频。
7.根据权利要求6所述的基于深度网络嵌入音频水印的装置,其特征在于,所述编码器中使用的U-net网络的上采样阶段与下采样阶段采用相同数量层次的卷积操作,且使用跨越连接的结构将下采样层与上采样层相连。
8.根据权利要求7所述的基于深度网络嵌入音频水印的装置,其特征在于,所述U-net的下采样部分由四块编码器组成,每块编码器是由2维卷积网络构成,用于批量归一化处理;频域特征经过4块编码器的映射之后,得到的维数减小到8*2*256;之后用四块编码器进行升采样操作,每块编码器是由2维卷积网络构成,用于批量归一化处理。
9.一种基于深度网络识别音频水印的装置,其特征在于,包括解码器,
所述解码器用于通过2维卷积网络对带水印的音频进行解码,得到水印信息,其中,解码过程包括:采用2维卷积网络,用于批量归一化处理。
10.根据权利要求9所述的基于深度网络识别音频水印的装置,其特征在于,所述解码器中,采用解码器进行解码;其中,解码器能够输出32个0-1之间的预测概率值,并且通过解码器损失函数得到水印信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于随锐科技集团股份有限公司,未经随锐科技集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111250867.9/1.html,转载请声明来源钻瓜专利网。





