[发明专利]乐谱识别方法、装置、设备及存储介质在审
| 申请号: | 202110322920.5 | 申请日: | 2021-03-26 |
| 公开(公告)号: | CN112926603A | 公开(公告)日: | 2021-06-08 |
| 发明(设计)人: | 梅亚琦;韩宝强;肖京 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
| 主分类号: | G06K9/46 | 分类号: | G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京市京大律师事务所 11321 | 代理人: | 姚维 |
| 地址: | 518033 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 乐谱 识别 方法 装置 设备 存储 介质 | ||
本发明涉及人工智能技术领域,公开了一种乐谱识别方法、装置、设备及存储介质,用于提高手写乐谱的识别效果。该方法包括:获取待识别手写乐谱图像;根据预设尺寸,对待识别手写乐谱图像进行调整,并基于调整后的手写乐谱图像提取待识别图像集;将待识别图像集输入预置的特征提取模型进行特征提取,得到待识别图像集的乐谱特征矩阵;将乐谱特征矩阵输入预置的特征识别模型中进行识别,得到初始识别结果矩阵;调用损失函数对初始识别结果矩阵进行优化,得到手写乐谱识别结果。本申请中方法能够提高对手写乐谱识别的效果,使识别结果更加准确。此外,本发明还涉及区块链技术,手写乐谱的相关信息可存储于区块链中。
技术领域
本发明涉及人工智能技术领域,尤其涉及一种乐谱识别方法、装置、设备及存储介质。
背景技术
一直以来,音乐大多一直通过手写乐谱进行传播。随着时间的推移,为了保护和传播优美音乐遗产,将乐谱进行数字化并进行保存至关重要。而如今全球等待录制的乐谱数以万计,人工录制费时费力又容易出差错,无疑对音乐制作者和传播者带来了极大的困难,因此,人们逐渐开始寻求能够自动识别乐谱并进行记录的技术手段。
现有的乐谱图片识别技术可以将乐谱图像转换为机器可读格式,其中有一些现有工具也能够对乐谱图片进行自动识别。
但在现有的技术中,由于人们的手写样式数不胜数,笔迹也参差不齐,软件辨识的准确度会大幅度下降,故现有的乐谱图片识别技术对手写的乐谱识别错误较多,识别结果不准确。
发明内容
本发明的主要目的在于解决现有的乐谱图片识别技术对手写的乐谱识别错误较多,识别结果不准确的问题。
本发明第一方面提供了一种乐谱识别方法,包括:
获取待识别手写乐谱图像;
根据预设尺寸,对所述待识别手写乐谱图像进行调整,并基于调整后的手写乐谱图像提取待识别图像集;
将所述待识别图像集输入预置的特征提取模型进行特征提取,得到所述待识别图像集的乐谱特征矩阵;
将所述乐谱特征矩阵输入预置的特征识别模型中进行识别,得到初始识别结果矩阵;
调用损失函数对所述初始识别结果矩阵进行优化,得到手写乐谱识别结果。
可选的,在本发明第一方面的第一种实现方式中,所述根据预设尺寸,对所述待识别手写乐谱图像进行调整,并基于调整后的手写乐谱图像提取待识别图像集包括:
根据所述待识别手写乐谱图像中的内容位置,将所述待识别手写乐谱图像分割成多个切分图像片;
在保持所述切分图像片的长宽比例不变的前提下,将所述多个切分图像片中每个切分图像片像素高度调整为预设像素高度,得到多个调整图像片;
将所述调整图像片按原顺序进行排列,得到待识别图像集。
可选的,在本发明第一方面的第二种实现方式中,所述特征提取模型包括卷积层和池化层,所述将所述待识别图像集输入预置的特征提取模型进行特征提取,得到所述待识别图像集的乐谱特征矩阵包括:
将所述待识别图像集输入至所述卷积层进行乐谱特征提取,得到乐谱特征图像集;
将乐谱特征图像集输入至所述池化层进行池化操作,将所述乐谱特征图像集中的手写乐谱图像按所述预设尺寸输出,得到所述待识别图像集的乐谱特征矩阵。
可选的,在本发明第一方面的第三种实现方式中,所述特征识别模型包括双向长短期记忆网络层和密集层,所述将所述乐谱特征矩阵输入预置的特征识别模型中进行识别,得到初始识别结果矩阵包括:
将所述乐谱特征矩阵输入至所述双向长短期记忆网络层中进行节奏和音调的识别,得到节奏输出矩阵和音调输出矩阵;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110322920.5/2.html,转载请声明来源钻瓜专利网。





