[发明专利]一种声音处理方法、装置与设备有效

专利信息
申请号: 201811152007.X 申请日: 2018-09-29
公开(公告)号: CN110970057B 公开(公告)日: 2022-10-28
发明(设计)人: 刘镇亿;赵文斌;李峰 申请(专利权)人: 华为技术有限公司
主分类号: G10L25/78 分类号: G10L25/78;G10L21/02;G10L21/0208;G10L21/0272;H04M1/72433;H04M1/72439;G06V40/16
代理公司: 深圳市深佳知识产权代理事务所(普通合伙) 44285 代理人: 王仲凯
地址: 518129 广东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 声音 处理 方法 装置 设备
【说明书】:

发明提出了一种声音处理方法,终端录制视频时,当前视频帧包含人脸且当前音频帧存在语音时,在当前视频帧中确定出目标人脸;获取目标人脸与终端之间的目标距离;根据目标距离确定出目标增益;目标距离越大,目标增益越大;从当前音频帧的声音信号中分离出语音信号;根据目标增益对语音信号进行增强处理,得到目标语音信号。实现录制视频过程中人声信号的自适应增强。

技术领域

本发明涉及终端技术领域,尤其涉及一种声音处理方法、装置与设备。

背景技术

随着终端技术的发展,一些智能终端中开始集成音源变焦功能,所谓音源变焦,可类比图像的变焦,是指用户利用手机进行录像时,当录制较远的画面时,录制的声音能适度放大,当录制较近的画面时,录制的声音能适度减小。即录像视频的声音大小随录制画面的远近而改变。在一些应用场景中,视频的声音可以通过变焦调节来实现音量调节,比如你录了几个人在说话的视频,可以单独指定放大视频中某个人的声音。例如,业界有HTCU12+音源变焦技术。在手机摄像过程中,当改变手机焦距信息的时候,录制的声音将随着焦距的改变而放大或缩小,从而实现音源变焦。具体图1a和图1b所示,当手机在录像过程中,由图1a所示的1.0x录像焦距变化到图b所示的3.0x录像焦距时,录像画面中所有的声音,包括人声与噪声的声音强度就会放大数倍;反之亦然。

智能终端应用越来越广泛,尤其是这种便携式的视频通话功能录制视频功能;使得人声变焦增强成为音源变焦中最为重要的场景,它是指针对录制声音中的人声部分,能够对人声有不同程度的放大或者减小。

在具体应用中,如手机录像场景下,用户期望对录制环境中的人声实现自适应的音源变焦,并且在人声变焦的同时,背景噪声能够保持平稳,不随人声的变化而变化。但是,目前业界对手机音频输入的变焦增强,仅停留着单一化的变焦层面上,即只是对前置或者后置摄像头画面内的所有声源的声音统一进行放大或者缩小,如录制的声音中包含有人声与噪声,这样带来的问题就是噪声也会被同步地放大或者缩小,导致最终输出的声音中,信噪比没有明显提升,对于人声的主观听感没有明显改善。而且人声变焦的实现需要依赖于用户对手机的特定输入,比如需要手势操作缩小或者放大录像画面,或者按键调整录像/录音的焦距信息等,借助这些输入,音源变焦实现起来更为容易,只需要根据给定的焦距信息来确定画面内人声的远近,然后放大或者减小音源强度即可。但是这样做带来的问题是,必须强依赖用户的输入,不能实现自适应处理,录像的画面内发声的人物由近处变到远处,如果用户认为没有改变焦距的必要,则不改变录像焦距,那么音源变焦就不会生效,但实际上此时的人声已经变小,需要进行变焦却没有变焦,因此无法适应人物在场景中前后发生移动的场景;此外,如果用户误操作了焦距调节信息,音源也会被误变焦;进而给用户带来很差的体验。

综上,现有技术存在如下缺陷:

1)无法识别人声和噪声,因此会连同人声和噪声一起放大或缩小,对于更感兴趣的人声的主观听感没有明显提升;

2)音源变焦依赖外部输入,不能解放用户;

3)用户的操作无法适应视频中发声人物前后移动的场景,同时容易造成误操作。

发明内容

本发明提出一种声音处理方法,具体地,提供一种智能人声变焦增强的方法,能够自适应的区分录制场景。对非人声场景(如音乐会,户外等),在保真录制的前提下,削弱环境噪声,减弱噪声影响,然后再进行音源变焦。对于人声场景(如会议,演讲等),进行较强的人声增强降噪。在此基础上,可以进一步地根据发声人物与拍摄终端的距离,实现自适应的人声变焦,无需用户特定的实时输入,并在增强人声的同时,抑制其他的干扰噪声,显著提升拍摄视频中不同距离的人声的主观语音听感。

本发明实施例提供的具体技术方案如下:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811152007.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top