[发明专利]一种音频信号转视觉颜色信息的方法及系统有效
| 申请号: | 201410833247.1 | 申请日: | 2014-12-29 |
| 公开(公告)号: | CN104464741B | 公开(公告)日: | 2018-04-06 |
| 发明(设计)人: | 徐永键;陆许明;刘志敏;谭洪舟 | 申请(专利权)人: | 中山大学花都产业科技研究院;中山大学 |
| 主分类号: | G10L19/032 | 分类号: | G10L19/032;H04N9/64 |
| 代理公司: | 广州粤高专利商标代理有限公司44102 | 代理人: | 林丽明 |
| 地址: | 510800 广东省广*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 音频 信号 视觉 颜色 信息 方法 系统 | ||
技术领域
本发明涉及音频信号处理领域,更具体地,涉及一种音频信号转视觉颜色信息的方法及系统。
背景技术
音乐和美术都是艺术的重要组成部分。就像绘画需要各种颜色一样,音乐的音色也是多种多样的。在很早以前人们就把音乐的音色和颜色联系在一起,比如十七世纪的德国人基歇尔,他曾提出:音乐是光线的模仿,二者是可以互为表达的。后来这一理论由法国人卡斯特尔所证实,他在1720 年出版了《音乐与色彩》一书,并在1734年设计了一种“视觉哈普西科德”,即将音阶按光谱的位置排列分配,一个键连接一种颜色,按键演奏乐谱,光线就从透明色彩带传出。后来也有许多科学家、艺术家甚至是文学家把音乐和色彩联系在一起,1876年,当时著名音乐家波萨科特提出了一个音乐家们可以接受的比拟:弦乐、人声——黑色;铜管、鼓——红色;木管——蓝色。而指挥家高得弗来提出的见解是:长笛——蓝色;单簧管——玫瑰色;铜管——红色。这种比拟在当时得到更多人的赞同,但显然它是带有浓厚的个人主观色彩的。十八世纪伟大的科学家牛顿发现了光的粒子性,而后人们又发现了光的波动性,并通过三棱镜析出了七种颜色:红橙黄绿青蓝紫。这样一来,就有人将音乐中的七个音和这七种色彩联系起来,同样的这种对应关系显然是机械性的,并没有多大意义。
如今,人们对音乐和颜色的联系有了跟进一步的认识。北京中星微电子有限公司的一篇专利《一种音乐控制发光灯组的亮度和颜色的方法》中提到,通过建立查找表的方式建立音乐和色彩的联系,所述查找表的每一行均存储有一组发光灯的控制参数,所述发光灯的控制参数与多色发光灯组显示的颜色和亮度相对应。显然,这种对应关系是有限的,是一种不太严谨的对应规律。《哈尔滨理工大学学报》第6期第18卷的论文《基于音频信号频谱分析的混合光效设计与实现》中提到:“对于RGB混合光效,可以明显观测到在不同的频率下,不同的幅值下,光的颜色和光强各不相同,这就是利用了PWM的不同占空比形成的。”但它并没有详细分析音乐(音频信号)与颜色之间的具体的映射关系。基于以上分析,本发明根据模拟音频信号的时域和频域分析将从音乐中提取颜色信息,实现音乐的彩色化效果。
一直到现今大部分的艺术家都是根据人们的感情因素将音乐和颜色联系在一起的,但这是并没有一个有效的有规律的映射方法。随着科学技术发展,人们对声音和光有了新的认识,虽然声音属于机械波,光波属于电磁波,但它们都有波的一切特性,如:都能产生反射、折射、干涉、衍射等现象。另外,他们都具有波的一些基本属性,如:波速、波长、频率之间的关系,我们就会很容易地将声音的频率和光的频率联系在一起。比如,将人的耳朵能听到的声音的频率范围联系到可见光的频率范围,最典型的是从白色光中析出了七种色彩对应七个基本音阶,这种映射关系是有一定的道理,它大致符合了音色和颜色的对应关系,但这种映射关系是有限的,并不够严谨。
发明内容
本发明提供一种映射关系严谨的音频信号转视觉颜色信息的方法。
本发明的又一目的在于提供一种音频信号转视觉颜色信息的系统。
为了达到上述技术目的,本发明的技术方案如下:
一种音频信号转视觉颜色信息的方法,包括以下步骤:
S1:对音频信号进行采样;
S2:计算音频信号的亮度V;
S3:计算音频信号的色相H和饱和度S;
S4:将亮度V、色相H和饱和度S进行RGB颜色格式转换;
S5:将S4中得到的RGB值进行颜色混合最终提取音频信号的颜色值。
进一步地,所述步骤S1中的音频信号包括模拟音频信号和数字音频信号;
对模拟音频信号进行采样的过程如下:
在单位时间T内采样N个点为一帧信号,N=2M,M为正整数;
对数字音频信号进行采样的过程如下:
对数字音频信号进行重采样,根据音频的采样率与重采样的频率选择增采样或减采样倍数,获取单位时间T内N个点为一帧的采样信号,N=2M,M为正整数。
进一步地,所述步骤S2中计算音频信号的亮度V的过程如下:
单位时间T内的音频信号的平均能量:
设音频信号的最大能量为Emax,一帧采样信号对应的亮度V:
。
进一步地,所述步骤S3的过程如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学花都产业科技研究院;中山大学,未经中山大学花都产业科技研究院;中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410833247.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:发音韵律问题的检测方法及装置
- 下一篇:一种语音播报系统和方法





