[发明专利]一种数字视音频监控系统中音频可视化监控的方法在审

申请号：	201710216097.3	申请日：	2017-04-05
公开（公告）号：	CN108694937A	公开（公告）日：	2018-10-23
发明（设计）人：	陈荣伟	申请（专利权）人：	陈荣伟
主分类号：	G10L15/02	分类号：	G10L15/02;G10L15/08;H04N7/18
代理公司：	暂无信息	代理人：	暂无信息
地址：	200137 上海市***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：	一种数字视音频监控系统中音频可视化监控的方法。方法包括：对实时解码后的每帧音频数据提取音频短时能量，归一化处后顺序存储到循环音频短时能量队列中;对每帧音频数据提取短时过门限率；根据音频短时过门限率和短时能量判断声音起点和终点,从声音起点开始提取音频特征向量并进行存储,当检测到声音终点后结束存储；根据所存储的若干音频特征向量提取声纹模型，将声纹模型与已存储的多个样本声纹模型进行比对和分类；对声音短时能量队列中各帧的能量值、各帧与最新帧的距离分别进行换算，在视频图像上从右至左连线各坐标点，画出一段时间内的音频波形曲线，并将音频分类名称叠加在相应曲线段的上方,实现音频监控的可视化。
搜索关键词：	短时能量声纹模型存储音频特征向量可视化监控数字视音频监控系统音频数据队列声音终点实时解码视频图像顺序存储音频波形音频分类音频监控归一化可视化曲线段坐标点比对换算连线叠加样本分类检测
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种数字视音频监控系统中音频可视化监控的方法，其特征在于,包括：计算每帧音频短时能量、归一化以后存入有限长度的循环队列, 计算每帧音频过门限率；判断声音起点和终点，提取并存储起点和终点之间每帧音频的特征向量；提取即时声纹模型，和已存储的样本声纹模型进行比对,判断声音类别；根据音频短期能量队列中各帧的能量值、各帧与最新帧的距离，在视频图像上绘制音频波形纹曲线并标注每个线段的声音类型，实现一段时间内的音频响度变化和音频类型变化监控的可视化。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于陈荣伟，未经陈荣伟许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201710216097.3/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种数字视音频监控系统中音频可视化监控的方法在审

专利文献下载