[发明专利]基于深层神经网络中间层特征的头相关传输函数建模系统有效
申请号: | 201710536423.9 | 申请日: | 2017-07-04 |
公开(公告)号: | CN107480100B | 公开(公告)日: | 2020-02-28 |
发明(设计)人: | 陶建华;戚肖克 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G06F17/15 | 分类号: | G06F17/15 |
代理公司: | 北京瀚仁知识产权代理事务所(普通合伙) 11482 | 代理人: | 郭文浩;王世超 |
地址: | 100080 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深层 神经网络 中间层 特征 相关 传输 函数 建模 系统 | ||
本发明涉及本发明涉及电子行业信号处理技术领域,提出了一种基于深层神经网络中间层特征的头相关传输函数建模系统,该系统包括训练系统、建模系统;所述训练系统包括特征生成模块、模型训练模块、HRTF数据库;所述建模系统包括特征生成模块、预测模块、HRTF重建模块;所述特征生成模块用以生成模型输入特征;所述模型训练模块用以在所述模型输入特征与HRTF数据库中的HRTF之间产生非线性映射;所述HRTF数据库用于存储HRTF;所述预测模块用以针对目标位置产生对数幅度最小相位HRTF;所述HRTF重建模块用以重构目标位置处的HRTF。本发明充分利用了HRTF数据与基函数之间的非线性关系,并提高模型准确度。
技术领域
本发明涉及电子行业信号处理技术领域,尤其涉及一种基于深层神经网络中间层特征的头相关传输函数建模系统。
背景技术
虚拟现实领域的爆发使得虚拟听觉受到越来越多的关注。虚拟现实包含虚拟视觉和虚拟听觉,其中,虚拟听觉技术的重点问题是恢复与自然听觉相同的定位特征。人类的听觉过程通常可视为声源-信道-接收模型,其中信道包含声源经过人体不同部位的衍射、干扰,最终到达鼓膜的过程,可看作一个空间数字滤波器,称为头相关传输函数(Head-Related Transfer Function,HRTF),它包含了声波与身体部位之间的交互引起的所有谱特征。由于每个人的生理结构不尽相同,HRTF谱特征是极其个性化的。然而,很难对每个个体在全空间内测量HRTF。另一个问题为很难对密集测量的HRTF数据库有效存储。
目前有线性建模的方法:一种方法为将HRTF建模到低维空间,如采用主成分分析方法,或者空间主成分分析,将空间的变化建模为少量主成分的联合。然而,这类方法很难将离散测量的HRTF插值成全空间的连续HRTF。另一种方法是采用基于表面球谐函数的建模(Spherical Harmonics-based Modeling,SHM))方法,通过在全空间建模为相对少量的球谐扩展系数的线性组合重建HRTF。然而,这些方法仅考虑了系数与基函数进行线性组合,没有利用HRTF数据与基函数之间的非线性关系。
发明内容
为了解决现有技术中的上述问题,即为了充分利用HRTF数据与基函数之间的非线性关系以提高模型准确度,本发明提出了一种基于深层神经网络中间层特征的头相关传输函数建模系统,包括训练系统、建模系统;
所述训练系统包括特征生成模块、模型训练模块、HRTF数据库;所述建模系统包括特征生成模块、预测模块、HRTF重建模块;
所述特征生成模块用以基于领域知识分别从声波传输理论和感知理论角度出发生成模型输入特征;
所述模型训练模块用以在所述模型输入特征与HRTF数据库中的HRTF之间产生非线性映射,并对所述预测模块进行训练;所述模型训练模块中基于领域知识分别从声波传输理论和感知理论角度出发生成损失函数;
所述HRTF数据库用于存储HRTF;
所述预测模块用以针对目标位置产生对数幅度最小相位HRTF;
所述HRTF重建模块用以通过所述预测模块输出的模型系数,重构目标位置处的HRTF。
优选地,所述特征生成模块包括方向特征生成模块、距离特征生成模块、特征合并模块、特征预处理模块;
所述方向特征生成模块用于产生当前位置处方向相关的特征;
所述距离特征生成模块用于产生当前位置处距离相关的特征;
所述特征合并模块用于合并所述方向相关的特征与所述距离相关的特征;
所述特征预处理模块用于对所述特征合并模块的输出的特征进行预处理,将输入特征归一化在均值为0、方差为1的值内。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710536423.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于可编程逻辑控制的快速傅里叶变换装置
- 下一篇:一种相关数据序列的生成方法