[发明专利]电话背景音乐检测模型方法、系统、设备及介质在审
| 申请号: | 201911358912.5 | 申请日: | 2019-12-25 |
| 公开(公告)号: | CN111049997A | 公开(公告)日: | 2020-04-21 |
| 发明(设计)人: | 郝竹林;罗超;胡泓;王俊彬 | 申请(专利权)人: | 携程计算机技术(上海)有限公司 |
| 主分类号: | H04M3/50 | 分类号: | H04M3/50;H04M3/51;G10L25/78;G10L25/81 |
| 代理公司: | 上海弼兴律师事务所 31283 | 代理人: | 薛琦;张冉 |
| 地址: | 200335 上海市*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 电话 背景音乐 检测 模型 方法 系统 设备 介质 | ||
1.一种电话背景音乐检测模型,其特征在于,所述电话背景音乐检测模型包括输入层、音频CNN层、拼接层、卷积层、全连接层和输出层;
所述输入层用于接收电话背景音乐的帧信息并对所述帧信息进行特征提取得到预设维度的特征;
所述音频CNN层包括若干路相并行的一维卷积层,所述音频CNN层用于通过所述一维卷积层分别对所述预设维度的特征进行卷积计算并得到每一路所述一维卷积层对应的第一特征数据;
所述拼接层用于对所述第一特征数据进行连接得到第二特征数据;
所述卷积层用于对所述第二特征数据进行卷积计算得到第三特征数据;
所述全连接层用于根据所述第三特征数据得到所述帧信息的概率;
所述输出层用于根据所述概率得到是否为电话背景音乐的判断结果。
2.如权利要求1所述的电话背景音乐检测模型,其特征在于,所述音频CNN层还包括第一池化层和Flatten层,所述第一池化层连接于所述一维卷积层的尾部,所述Flatten层连接于所述第一池化层的尾部;所述第一池化层用于对所述一维卷积层对所述预设维度的特征进行卷积计算得到的结果进行池化;所述Flatten层用于对所述池化的结果进行压平得到所述第一特征数据;
和/或,
所述卷积层包括多层二维卷积层和第二池化层,所述第二池化层设置于每层所述二维卷积层的尾部,所述多层二维卷积层用于对所述第二特征数据进行逐层卷积计算,所述第二池化层用于对逐层卷积计算的结果进行池化得到所述第三特征数据;
和/或,
所述全连接层包括随机失活层和多层全连接网络层,所述随机失活层设置于所述多层全连接网络层的相邻的两层之间。
3.一种电话背景音乐检测方法,其特征在于,所述电话背景音乐检测方法应用如权利要求1或2所述的电话背景音乐检测模型实现,所述电话背景音乐检测方法包括:
对输入电话语音进行静音切割得到音频片段;
对所述音频片段进行分帧得到对应的帧信息;
将所述帧信息输入至所述电话背景音乐检测模型得到所述判断结果。
4.如权利要求3所述的电话背景音乐检测方法,其特征在于,所述将所述帧信息输入至所述电话背景音乐检测模型得到所述判断结果的步骤之前还包括:
对所述帧信息进行过滤得到有效的所述帧信息;
将所述有效的帧信息输入至所述电话背景音乐检测模型。
5.如权利要求4所述的电话背景音乐检测方法,其特征在于,所述对所述帧信息进行过滤得到有效的所述帧信息的步骤包括:
对所述帧信息作预加重处理;
对预加重后的所述帧信息放大;
对放大后的所述帧信息进行能量计算得到对应的帧能量;
根据所述帧能量得到有效的所述帧信息。
6.如权利要求5所述的电话背景音乐检测方法,其特征在于,所述根据所述帧能量得到有效的所述帧信息的步骤包括:
设置预设阈值能量;
判断所述帧能量是否大于所述预设阈值能量,若判断结果为是,则确定所述帧能量对应的所述帧信息为有效的所述帧信息。
7.如权利要求3所述的电话背景音乐检测方法,其特征在于,所述电话背景音乐检测方法还包括对所述电话背景音乐检测模型进行训练的步骤,所述对所述电话背景音乐检测模型进行训练的步骤包括:
分别设置所述输入层、所述音频CNN层、所述拼接层、所述卷积层、所述全连接层的参数值;
设置损失函数和优化方法;
利用样本音频片段作为输入;
根据所述样本音频片段设置是否为电话背景音乐的标签,将所述标签作为输出;
根据所述损失函数和所述优化方法对所述电话背景音乐检测模型进行迭代训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于携程计算机技术(上海)有限公司,未经携程计算机技术(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911358912.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:空调室内机及具有其的空调系统
- 下一篇:一种含主动冷却通道的蒙皮深孔加工方法





