[发明专利]和弦识别方法、装置、设备及存储介质在审
| 申请号: | 202110322909.9 | 申请日: | 2021-03-26 |
| 公开(公告)号: | CN112927667A | 公开(公告)日: | 2021-06-08 |
| 发明(设计)人: | 刘奡智;韩宝强;肖京 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
| 主分类号: | G10H1/38 | 分类号: | G10H1/38;G06F17/14;G06N3/04;G06N3/08;G06N20/00 |
| 代理公司: | 北京市京大律师事务所 11321 | 代理人: | 姚维 |
| 地址: | 518033 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 和弦 识别 方法 装置 设备 存储 介质 | ||
本发明涉及人工智能技术领域,公开了一种和弦识别方法、装置、设备及存储介质,用于针对音频中的和弦进行识别。该方法包括:获取待识别的音频文件;利用预先建立好的和弦音高数据提取模型,对音频文件的特征数据进行提取,得到至少一段和弦音高特征数据;利用双通道Transformer模型,对和弦音高特征数据分别进行初步识别和修正识别,得到和弦音高特征数据的初始识别结果和修正识别结果;根据修正识别结果对初始识别结果进行修正,得到和弦乐谱。该和弦识别方法可以对音频文件中的和弦进行提取并识别,得到和弦识别结果,提高了对和弦识别的速度和准确度。
技术领域
本发明涉及人工智能技术领域,尤其涉及一种和弦识别方法、装置、设备及存储介质。
背景技术
和弦是一种非常抽象且重要的音乐表达载体,是所有音乐作品中必不可少的组成部分。但是人工识别需要十分专业的人士反复听取并进行识别,通常费时费力;采用音频识别技术进行识别时又因为和弦具有虽然由多个音组成但是却只有一条正弦波的特点,使得传统的音频识别技术无法拆解和识别和弦的声波。
现有技术中,有些机器学习模型尝试用神经卷积网络和循环神经网络来识别音乐和弦,但是都存在和弦识别不准确、效果不理想的问题。
发明内容
本发明的主要目的在于解决现有技术中对和弦进行识别时识别准确度低的技术问题。
本发明第一方面提供了一种和弦识别方法,包括:
获取待识别的音频文件;
利用预先建立好的和弦音高数据提取模型,对所述音频文件的特征数据进行提取,得到至少一段和弦音高特征数据;
利用双通道Transformer模型,对所述和弦音高特征数据分别进行初步识别和修正识别,得到所述和弦音高特征数据的初始识别结果和修正识别结果;
根据所述修正识别结果对所述初始识别结果进行修正,得到和弦乐谱。
可选的,在本发明第一方面的第一种实现方式中,所述利用预先建立好的和弦音高数据提取模型,对所述音频文件的特征数据进行提取,得到至少一段和弦音高特征数据包括:
利用短时傅里叶变换函数对所述音频文件进行短时傅里叶变换,得到所述音频文件的特征数据;
根据所述特征数据,利用所述和弦音高数据提取模型对所述特征数据中的和弦音高特征数据进行识别并提取,得到至少一段和弦音高特征数据。
可选的,在本发明第一方面的第二种实现方式中,所述根据所述特征数据,利用所述和弦音高数据提取模型对所述特征数据中的和弦音高特征数据进行识别并提取,得到至少一段和弦音高特征数据包括:
利用所述和弦音高提取模型对所述特征数据进行识别,将仅包含单音的特征数据进行丢弃,得到至少一段包含和弦片段的特征数据;
对所述包含和弦片段的特征数据进行识别,并将识别到的节奏数据和音色数据进行丢弃,得到至少一段和弦音高特征数据。
可选的,在本发明第一方面的第三种实现方式中,所述利用双通道Transformer模型,对所述和弦音高特征数据分别进行初步识别和修正识别,得到所述和弦音高特征数据的初始识别结果和修正识别结果包括:
利用所述双通道Transformer模型中对所述和弦音高特征数据分别进行至少两次的前向识别以及后向识别,得到前向识别结果和后向识别结果;
利用全连接层将第一次识别的前向识别结果和后向识别结果进行合成,得到初始识别结果;
利用全连接层将第二次和第二次之后识别的,前向识别结果和后向识别结果进行合成得到修正识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110322909.9/2.html,转载请声明来源钻瓜专利网。





