[发明专利]一种自动识别中国少数民族传统乐器音频数据的方法无效
| 申请号: | 201310226990.6 | 申请日: | 2013-06-07 |
| 公开(公告)号: | CN103325382A | 公开(公告)日: | 2013-09-25 |
| 发明(设计)人: | 郑蕊蕊;李敏;张俊星;吴宝春 | 申请(专利权)人: | 大连民族学院 |
| 主分类号: | G10L25/30 | 分类号: | G10L25/30 |
| 代理公司: | 大连一通专利代理事务所(普通合伙) 21233 | 代理人: | 秦少林 |
| 地址: | 116600 辽宁省大连市开*** | 国省代码: | 辽宁;21 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 自动识别 中国 少数 民族传统 乐器 音频 数据 方法 | ||
1.一种自动识别中国少数民族传统乐器音频数据的方法,其特征在于:其内容包括如下步骤:
步骤1:采用录音设备采集由少数民族传统乐器弹奏的音频信号;
步骤2:对音频信号进行预处理,主要包括抗混叠滤波、预加重、分帧和端点检测等内容;
步骤3:音频特征提取采用MFCC提取的音频特征;MFCC的计算首先是对数据加窗;
对加窗后的时域信号采用傅里叶变换转化到频域,之后对其对数能量谱用依照Mel刻度分布的三角滤波器组进行卷积,最后对各个滤波器的输出构成的向量进行离散余弦变换,取前N个系数;再将频域轴用Mel刻度表示即为Mel倒谱域,用倒谱域表示的系数即为Mel频率倒谱系数;最终提取的我国少数民族传统乐器音频特征为24维数据;
步骤4:采用BP人工神经网络分类器分三层结构,第一层是输入层,24个结点;第二层为隐含层,结点个数采用遗传算法根据训练结果自动择优确定;第三层是输出层,根据分类的少数民族乐器数目确定设定为48个;最后训练完的BP人工神经网络可识别音频数据的弹奏乐器,并显示对应的乐器图片。
2.根据权利要求1所述的一种自动识别中国少数民族传统乐器音频数据的方法,其特征在于:步骤1所采集的少数民族传统乐器包括:蒙古族马头琴和胡拨思;朝鲜族伽倻琴、长鼓和上帽;哈萨克族冬不拉和柯布孜;壮族四弦胡和铜铃、边鼓、高边锣和蜂鼓;苗族芦笙、苗笛和铜鼓;景颇族象脚鼓;满族八角鼓;瑶族长鼓和长号;仡佬族八音鼓;佤族木鼓和小独笛;羌族手鼓和羌笛;赫哲族抓鼓;侗族侗笛和叶子笛;傈僳族竹号;维吾尔族热瓦甫、卡龙琴、弹拨尔、萨它尔、维吾尔族扬琴、达甫和皮皮;柯尔克孜族卡姆孜和克亚克;塔吉克族苏那依和那艺;乌孜别克族纳格拉和艾捷克;彝族月琴;傣族口弦和铜响器;京族独弦琴;哈尼族巴乌;锡伯族苇笛;纳西族铜锣。
3.根据权利要求1所述的一种自动识别中国少数民族传统乐器音频数据的方法,其特征在于:步骤2所述的预加重是采用一阶有限激励响应高通滤波器网络,来增强声音信号的高频部分以提高声音的高频分辨率。
4.根据权利要求1所述的一种自动识别中国少数民族传统乐器音频数据的方法,其特征在于:步骤2所述的分帧和端点检测是指音乐信号设计采用帧长256个采样点,帧移为80个采样点,即占帧长的5/16,采样频率为44100Hz时,帧长为256/44100*1000=5.8ms;利用短时能量和过零率两者配合实现可靠的端点检测,分别采用有短时平均能量和短时平均过零率两种端点检测方法提取端点,经过比较确定时间最近的端点。
5.根据权利要求1所述的一种自动识别中国少数民族传统乐器音频数据的方法,其特征在于:步骤3所述的音频信号特征采用MFCC倒谱系数特征。
6.根据权利要求1所述的一种自动识别中国少数民族传统乐器音频数据的方法,其特征在于:步骤3所述的加窗采用加汉明窗的方法,其两端具有平滑过渡性并能减少帧起始和结束处的信号不连续性。
7.根据权利要求1所述的一种自动识别中国少数民族传统乐器音频数据的方法,其特征在于:步骤4所述的BP人工神经网络分三层,第一层为输入层,结点个数为24个,第二层为中间层,其结点个数采用遗传算法根据人工神经网络的训练结果确定,第三层为输出层,结点个数根据分类的少数民族乐器数目确定设定为48个。并能够在识别乐器种类的同时显示对应的乐器图片。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连民族学院,未经大连民族学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310226990.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:升降机构
- 下一篇:一种像素电路、显示装置及像素电路的驱动方法





