[发明专利]音频播放方法、装置、设备及计算机可读存储介质在审

申请号：	202210632201.8	申请日：	2022-06-02
公开（公告）号：	CN114822568A	公开（公告）日：	2022-07-29
发明（设计）人：	李新林;马连群;吴宜安	申请（专利权）人：	深圳创维-RGB电子有限公司
主分类号：	G10L21/003	分类号：	G10L21/003;G10L21/007;G10L21/02;G10L25/27
代理公司：	深圳市世纪恒程知识产权代理事务所 44287	代理人：	林川靖
地址：	518057 广东省深圳市南山区粤海***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	音频播放方法装置设备计算机可读存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种音频播放方法、装置、设备及计算机可读存储介质，属于音视频播放技术领域。本发明通过监测当前所输出的视频画面中是否存在预设特征图像；若存在，则获取所述预设特征图像的发声位置信息；获取所述视频画面对应的原始音频信号，根据所述发声位置信息调整所述原始音频信号得到重建声场位置后的目标音频信号；输出所述目标音频信号以进行音频播放。本发明解决了在播放音频时无法准确还原语音位置，语音临场感较差的技术问题，实现了提升音频播放时的语音临场感和辨识度的技术效果。

技术领域

本发明涉及音视频处理技术领域，尤其涉及一种音频播放方法、装置、设备及计算机可读存储介质。

背景技术

随着生活水平的日益提高，人们对日常生活中的娱乐产品性能和功能提出了更高的要求。在使用平板电脑、电视等视频播放设备观看视频节目时，人们往往希望得到更加逼真的视听体验，因此，对视频播放设备的音画质也提出了更高的要求。

一般在影视节目中，人物对话通常占据了很大的场景，故提高发声人的位置准确度，使得观众听见的人声与发声人在屏幕上一致，可以增强观众的临场感，大大提高用户的体验。目前大多播放设备使用左右两组喇叭发声，对于双声道立体声的声源还原较好，但对于单声道或立体声不强的双声道音源，音频播放效果就不是很理想。此外，也有一些通过虚拟环绕声技术来改善并营造一个虚拟立体声的效果，但由于其使用固定算法，故对于声音的定位也不够准确。

因此，现有技术中存在播放音频时无法准确还原语音位置，语音临场感较差的技术问题。

发明内容

本发明的主要目的在于提供一种音频播放方法、装置、设备及计算机可读存储介质，旨在解决播放音频时无法准确还原语音位置，语音临场感较差的技术问题。

为实现上述目的，本发明提供一种音频播放方法，所述方法包括以下步骤：

监测当前所输出的视频画面中是否存在预设特征图像；

若存在，则获取所述预设特征图像的发声位置信息；

获取所述视频画面对应的原始音频信号，根据所述发声位置信息调整所述原始音频信号得到重建声场位置后的目标音频信号；

输出所述目标音频信号以进行音频播放。

可选地，所述获取所述预设特征图像的发声位置信息的步骤，包括：

根据所述预设特征图像的大小获取所述预设特征图像的距离信息；

获取所述预设特征图像的发声位置坐标信息，将所述发声位置坐标信息和所述距离信息作为所述发声位置信息。

可选地，所述根据所述发声位置信息调整所述原始音频信号得到重建声场位置后的目标音频信号的步骤，包括：