[发明专利]音频播放方法、装置、设备及计算机可读存储介质在审
| 申请号: | 202210632201.8 | 申请日: | 2022-06-02 |
| 公开(公告)号: | CN114822568A | 公开(公告)日: | 2022-07-29 |
| 发明(设计)人: | 李新林;马连群;吴宜安 | 申请(专利权)人: | 深圳创维-RGB电子有限公司 |
| 主分类号: | G10L21/003 | 分类号: | G10L21/003;G10L21/007;G10L21/02;G10L25/27 |
| 代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 林川靖 |
| 地址: | 518057 广东省深圳市南山区粤海*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 音频 播放 方法 装置 设备 计算机 可读 存储 介质 | ||
本发明公开了一种音频播放方法、装置、设备及计算机可读存储介质,属于音视频播放技术领域。本发明通过监测当前所输出的视频画面中是否存在预设特征图像;若存在,则获取所述预设特征图像的发声位置信息;获取所述视频画面对应的原始音频信号,根据所述发声位置信息调整所述原始音频信号得到重建声场位置后的目标音频信号;输出所述目标音频信号以进行音频播放。本发明解决了在播放音频时无法准确还原语音位置,语音临场感较差的技术问题,实现了提升音频播放时的语音临场感和辨识度的技术效果。
技术领域
本发明涉及音视频处理技术领域,尤其涉及一种音频播放方法、装置、设备及计算机可读存储介质。
背景技术
随着生活水平的日益提高,人们对日常生活中的娱乐产品性能和功能提出了更高的要求。在使用平板电脑、电视等视频播放设备观看视频节目时,人们往往希望得到更加逼真的视听体验,因此,对视频播放设备的音画质也提出了更高的要求。
一般在影视节目中,人物对话通常占据了很大的场景,故提高发声人的位置准确度,使得观众听见的人声与发声人在屏幕上一致,可以增强观众的临场感,大大提高用户的体验。目前大多播放设备使用左右两组喇叭发声,对于双声道立体声的声源还原较好,但对于单声道或立体声不强的双声道音源,音频播放效果就不是很理想。此外,也有一些通过虚拟环绕声技术来改善并营造一个虚拟立体声的效果,但由于其使用固定算法,故对于声音的定位也不够准确。
因此,现有技术中存在播放音频时无法准确还原语音位置,语音临场感较差的技术问题。
发明内容
本发明的主要目的在于提供一种音频播放方法、装置、设备及计算机可读存储介质,旨在解决播放音频时无法准确还原语音位置,语音临场感较差的技术问题。
为实现上述目的,本发明提供一种音频播放方法,所述方法包括以下步骤:
监测当前所输出的视频画面中是否存在预设特征图像;
若存在,则获取所述预设特征图像的发声位置信息;
获取所述视频画面对应的原始音频信号,根据所述发声位置信息调整所述原始音频信号得到重建声场位置后的目标音频信号;
输出所述目标音频信号以进行音频播放。
可选地,所述获取所述预设特征图像的发声位置信息的步骤,包括:
根据所述预设特征图像的大小获取所述预设特征图像的距离信息;
获取所述预设特征图像的发声位置坐标信息,将所述发声位置坐标信息和所述距离信息作为所述发声位置信息。
可选地,所述根据所述发声位置信息调整所述原始音频信号得到重建声场位置后的目标音频信号的步骤,包括:
根据所述发声位置信息调整所述原始音频信号中的语音信号得到重建声场位置后的目标语音信号;
通过将所述目标语音信号与所述原始音频信号中的背景音信号混合,以得到重建声场位置后的所述目标音频信号。
可选地,所述根据所述发声位置信息调整所述原始音频信号中的语音信号得到重建声场位置后的目标语音信号的步骤,包括:
根据所述发声位置坐标信息和所述距离信息分别获取第一系数和第二系数;
根据所述第一系数调节所述语音信号的参数得到左声道语音增强信号;
根据所述第二系数调节所述语音信号的参数得到右声道语音增强信号;
将所述左声道语音增强信号和所述右声道语音增强信号作为所述重建声场位置后的目标语音信号。
可选地,在所述根据所述发声位置信息调整所述原始音频信号中的语音信号得到重建声场位置后的目标语音信号的步骤之前,还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳创维-RGB电子有限公司,未经深圳创维-RGB电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210632201.8/2.html,转载请声明来源钻瓜专利网。





