[发明专利]一种音频高潮识别方法和装置有效
| 申请号: | 201711312229.9 | 申请日: | 2017-12-07 |
| 公开(公告)号: | CN110019922B | 公开(公告)日: | 2021-06-15 |
| 发明(设计)人: | 高超;马哲 | 申请(专利权)人: | 北京雷石天地电子技术有限公司 |
| 主分类号: | G06F16/63 | 分类号: | G06F16/63 |
| 代理公司: | 北京城烽知识产权代理事务所(特殊普通合伙) 11829 | 代理人: | 王新月 |
| 地址: | 100101 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 音频 高潮 识别 方法 装置 | ||
本发明实施例提供了一种音频高潮识别方法和装置。该方法包括:将目标歌曲的词进行分词,标记高频词语出现的时间段为高频词时段;将所述目标歌曲的曲切割为等时长的多个切片;分别对每一切片进行快速傅里叶变换,得到所述每一切片的频域能量最高值;按时序顺次连接所述每一切片的频域能量最高值,得到切片的频域能量最高值在时间上的切片函数曲线;将所述高频词时段与所述切片函数曲线的波峰段重合的时段作为高潮时段。该方法和装置精确度高,适用范围广泛,节省大量人力资源。
技术领域
本发明涉及歌曲音频处理领域,特别涉及卡拉OK高潮部分的识别方法和装置。
背景技术
现有技术中识别歌曲的高潮部分所用的方法大多是根据歌词进行查找,由于歌曲的高潮部分普遍存在重唱的情况,通过这种方法定位到歌曲的高潮部分。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:现有技术的歌曲高潮部分识别方法的查找范围很有限,现有技术的歌曲高潮部分的识别方法的精确度低,适用范围小,识别到的高潮部分难以进行其他操作,如歌曲串烧制作等。现有技术的歌曲高潮识别方法费事费力,而且由于歌词中包含大量常用词汇,高频词汇的筛选结果需要人力的二次识别,耗费大量资源。
发明内容
本发明实施例提供一种音频高潮识别方法和装置,该技术基于歌曲的频域能量分析识别歌曲高潮的方法和装置,可以适用于所有歌曲、乐曲,适用范围广泛,克服上述现有的歌曲高潮部分的定位方法精确度低,适用范围小的缺陷。
为达到上述目的,本发明实施例一方面提供一种音频高潮识别方法,包括:
将目标歌曲的词进行分词,标记高频词语出现的时间段为高频词时段;
将所述目标歌曲的曲切割为等时长的多个切片;
分别对每一切片进行快速傅里叶变换,得到所述每一切片的频域能量最高值;
按时序顺次连接所述每一切片的频域能量最高值,得到切片的频域能量最高值在时间上的切片函数曲线;
将所述高频词时段与所述切片函数曲线的波峰段重合的时段作为高潮时段。
可选的,所述将目标歌曲的词进行分词,标记高频词语出现的时间段为高频词时段包括:
提取所述目标歌曲的词;
对所述目标歌曲的词进行分词,并统计其中重复频率达到预设阈值的词为高频词;
将所述高频词与其对应的时间进行匹配,得到高频词时段。
可选的,所述将所述目标歌曲的曲切割为等时长的多个切片,包括:
获取所述目标歌曲的曲的1/4拍的时长;
以该1/4拍的时长或其倍数作为切割的时间单位,将所述目标歌曲的曲切割为等时长的多个切片。
可选的,所述按时序顺次连接所述每一切片的频域能量最高值,得到切片的频域能量最高值在时间上的切片函数曲线,包括:
建立横轴为时间,纵轴为频域能量值的直角坐标系;其中,所述时间的原点为所述目标歌曲的时间起始点;
将每个切片的频域能量最高值作为纵坐标,将切片对应时间段的中间值作为横坐标,标记到所述直角坐标系;
用平滑曲线将每个切片对应的坐标点连接起来,得到切片的频域能量最高值在时间上的切片函数曲线。
可选的,所述将所述高频词时段与所述切片函数曲线的波峰段重合的时段作为高潮时段包括:
将所述高频词时段标记到所述直角坐标系的横轴上;
当以波峰作为中心点的波长λ超过预设波长阈值时,标记该相位标记为波峰段;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京雷石天地电子技术有限公司,未经北京雷石天地电子技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711312229.9/2.html,转载请声明来源钻瓜专利网。





