[发明专利]一种音频处理方法有效
| 申请号: | 201810432441.7 | 申请日: | 2018-05-08 |
| 公开(公告)号: | CN108419124B | 公开(公告)日: | 2020-11-17 |
| 发明(设计)人: | 易正宏 | 申请(专利权)人: | 北京酷我科技有限公司 |
| 主分类号: | H04N21/439 | 分类号: | H04N21/439;H04N21/8547;H04N21/443;H04N21/4782;H04N21/442;H04N21/2662 |
| 代理公司: | 北京亿腾知识产权代理事务所(普通合伙) 11309 | 代理人: | 陈霁 |
| 地址: | 100084 北京市海淀区农大*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 音频 处理 方法 | ||
本发明公开了一种音频处理方法,属于流媒体技术领域。该方法包括以下步骤:打开声音的音频文件,将时间粒度调节到预设时间范围;监测声音的音频文件波形,计算预设时间范围内的声音平均分贝值;根据声音平均分贝值确定声音能量的大小,当声音能量小于预设声音平均分贝阈值时,获得一个声音间隔;当一段时间内统计的声音间隔次数超过一定次数时,确定声音为说话模式;或当一段时间内统计的时间相邻一小段时间声音能量的比值超过一个阈值的次数时,确定声音为说话模式。在直播过程中,增加了对于音频处理的环节之后,系统会自动识别麦克风的音频采集内容,自动判断是说话还是唱歌,提高用户的使用感受。
技术领域
本发明涉及流媒体技术领域,尤其涉及一种音频处理方法。
背景技术
目前,网络直播是利用互联网及流媒体技术进行直播,主播用户客户端通过摄像头采集图像数据,麦克风采集音频数据,同步音频/视频之后进行推流,其他观众则会从CDN服务器拉取视频流进行观看。
在实际中,主播有可能会涉及谈话或者唱歌等表现形式,如果是唱歌形式,往往存在相应的伴奏等音频,但目前的直播工具往往不能辨别唱歌和谈话上的区别,造成在直播过程中,用户想进来听主播唱当前背景音乐时进来后可能发现主播正在那说话,并没有唱歌。
发明内容
本发明的目的,是解决主播过程中,根据音频流数据识别主播当前行为,技术方案如下:
打开声音的音频文件,将时间粒度调节到预设时间范围;
监测声音的音频文件波形,计算预设时间范围内的声音平均分贝值;
根据声音平均分贝值确定声音能量的大小,当声音能量小于预设声音平均分贝阈值时,获得一个声音间隔;
当一段时间内统计的声音间隔次数超过一定次数时,确定声音为说话模式;或
监测声音的音频文件波形,计算预设时间范围内的声音平均分贝值;
当一段时间内统计的时间相邻一小段时间声音能量的比值超过一个阈值的次数时,确定声音为说话模式。
优选地,说话模式的概率通过以下公式表示:P=W1P1+W2P2;
其中,P为说话模式概率,P1为时间间隔次数影响的说话模式概率,W1为P1所占权重,P2为声音能量比值超过阈值次数影响的说话模式概率,W2为P2所占权重;预设P0为预设说话模式概率阈值,比较P与P0的关系,判断当前是说话模式,还是唱歌模式。
本发明的有益效果在于:区别于目前的直播系统,增加了对于音频处理的环节之后,在直播过程中,系统会自动识别麦克风的音频采集内容,自动判断是说话还是唱歌,提高用户的使用感受。
附图说明
图1为本发明实施例提供的一种基于浏览器的音频/视频直播方法流程示意图。
图2为本发明实施例提供的一种基于浏览器的音频/视频直播系统结构示意图。
图3为本发明实施例提供的一种音频处理方法的流程示意图。
具体实施方式
下面通过实施例,对本发明的技术方案做进一步的详细描述。
图1为基于浏览器的音频/视频直播方法流程图。如图1所示,该方法包括以下步骤:
步骤110,安装于用户设备上的软件,利用TCP方式建立与浏览器之间的本地socket通信;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京酷我科技有限公司,未经北京酷我科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810432441.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种教学视频的虚拟切片方法
- 下一篇:多媒体课堂移动端的远程控制方法





