[发明专利]一种基于深度网络嵌入和识别音频水印的方法和装置在审

申请号：	202111250867.9	申请日：	2021-10-26
公开（公告）号：	CN113990330A	公开（公告）日：	2022-01-28
发明（设计）人：	李平;蒋升	申请（专利权）人：	随锐科技集团股份有限公司
主分类号：	G10L19/018	分类号：	G10L19/018;G10L25/30;G06N3/04;G06N3/08
代理公司：	北京兴智翔达知识产权代理有限公司 11768	代理人：	李琴
地址：	100192 北京市海淀区宝***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于深度网络嵌入识别音频水印方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于深度网络嵌入音频水印的方法，其特征在于，包括以下步骤：

S1：对原始音频进行分帧，并且对每个分帧进行加窗和短时傅里叶变换；

S2：将短时傅里叶变换后提取出来的频域特征作为U-net网络的输入，并且把水印信息嵌入到U-net网络中，进行编码；

S3：将编码后的频域特征进行短时傅里叶逆变换得到带水印的音频。

2.根据权利要求1所述的基于深度网络嵌入音频水印的方法，其特征在于，所述步骤S2中，U-net网络的上采样阶段与下采样阶段采用相同数量层次的卷积操作，且使用跨越连接的结构将下采样层与上采样层相连。

3.根据权利要求2所述的基于深度网络嵌入音频水印的方法，其特征在于，所述U-net的下采样部分由四块编码器组成，每块编码器是由2维卷积网络构成，用于批量归一化处理；频域特征经过4块编码器的映射之后，得到的维数减小到8*2*256；之后用四块编码器进行升采样操作，每块编码器是由2维卷积网络构成，用于批量归一化处理。

4.一种基于深度网络识别音频水印的方法，其特征在于，包括以下步骤：

S4：通过2维卷积网络对带水印的音频进行解码，得到水印信息，其中，解码过程包括：采用2维卷积网络，用于批量归一化处理。

5.根据权利要求4所述的基于深度网络识别音频水印的方法，其特征在于，所述步骤S4中，采用解码器进行解码；解码器能够输出32个0-1之间的预测概率值，并且通过解码器损失函数得到水印信息。

6.一种基于深度网络嵌入音频水印的装置，其特征在于，包括预处理模块、编码器和处理模块，

所述预处理模块用于对原始音频进行分帧，并且对每个分帧进行加窗和短时傅里叶变换；

所述编码器用于将短时傅里叶变换后提取出来的频域特征作为U-net网络的输入，并且将水印信息嵌入到U-net网络中，进行编码；

所述处理模块用于将编码后的频域特征进行短时傅里叶逆变换得到带水印的音频。

7.根据权利要求6所述的基于深度网络嵌入音频水印的装置，其特征在于，所述编码器中使用的U-net网络的上采样阶段与下采样阶段采用相同数量层次的卷积操作，且使用跨越连接的结构将下采样层与上采样层相连。

8.根据权利要求7所述的基于深度网络嵌入音频水印的装置，其特征在于，所述U-net的下采样部分由四块编码器组成，每块编码器是由2维卷积网络构成，用于批量归一化处理；频域特征经过4块编码器的映射之后，得到的维数减小到8*2*256；之后用四块编码器进行升采样操作，每块编码器是由2维卷积网络构成，用于批量归一化处理。

9.一种基于深度网络识别音频水印的装置，其特征在于，包括解码器，

所述解码器用于通过2维卷积网络对带水印的音频进行解码，得到水印信息，其中，解码过程包括：采用2维卷积网络，用于批量归一化处理。

10.根据权利要求9所述的基于深度网络识别音频水印的装置，其特征在于，所述解码器中，采用解码器进行解码；其中，解码器能够输出32个0-1之间的预测概率值，并且通过解码器损失函数得到水印信息。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于随锐科技集团股份有限公司，未经随锐科技集团股份有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202111250867.9/1.html，转载请声明来源钻瓜专利网。

上一篇：一种高浓度银微米球及其合成方法
下一篇：一种表面具有纳米锥尖结构的自支撑掺硼金刚石膜及其制备方法

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L19-00 用于冗余度下降情形
G10L19-02 .利用频谱分析，例如变换声码器或子频带声码器
G10L19-04 .利用预测技术
G10L19-06 ..例如短期预测系数的频谱特征的确定或编码
G10L19-08 ..激励函数的确定或编码；长期预测参数的确定或编码
G10L19-14 ..不包括在G10L 19/06至G10L 19/12组中的零部件，例如增益编码、后置滤波设计或声码器结构

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于深度网络嵌入和识别音频水印的方法和装置在审

专利文献下载