[发明专利]音频分段方法、装置、存储介质及电子设备在审

申请号：	202010613730.4	申请日：	2020-06-30
公开（公告）号：	CN111782863A	公开（公告）日：	2020-10-16
发明（设计）人：	王征韬	申请（专利权）人：	腾讯音乐娱乐科技（深圳）有限公司
主分类号：	G06F16/65	分类号：	G06F16/65;G06F16/683;G06N3/04;G06N3/08;G06F17/14
代理公司：	深圳翼盛智成知识产权事务所(普通合伙) 44300	代理人：	李汉亮
地址：	518000 广东省深圳市***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	音频分段方法装置存储介质电子设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明实施例公开了一种音频分段方法、装置、存储介质及电子设备。该方案将目标音频划分为多个音频片段，并提取每个音频片段的音频特征；根据预设特征提取算法从对应的音频特征中，提取每一音频片段的第一特征向量；将第一特征向量输入预设分类模型，以确定每一音频片段的初始段落类型；将各个音频片段的初始段落类型输入至时序相关损失函数层，以使时序相关损失函数层基于各个音频片段之间的时序关系，确定各个音频片段的目标段落类型；根据每一音频片段的目标段落类型，确定目标音频包括的段落类型和每个段落类型对应的段落的起止时间，以实现对音频进行精确分段并确定各段落的起止时间点。

技术领域

本发明涉及数据处理技术领域，具体涉及一种音频分段方法、装置、存储介质及电子设备。

背景技术

歌曲一般具有一定结构性的段落，例如主歌，副歌，桥段，插句等。主歌为音乐的基本内容，在歌词上对音乐内容做基本交代，音乐上一般较舒缓和平铺直叙。副歌，即一般所说的高潮段落，集中表现歌曲的主要感情，通常朗朗上口，容易让人记住。桥段一般包含前奏、间奏、结尾，起到分隔段落的作用。

在一些歌曲处理过程中，由于需要的歌曲段落不同，比如确定歌曲基调，音乐搜索，乐曲识别等等，也经常需要对歌曲的各个段落进行分析和处理。

但是，由于歌曲中信号的复杂性和不同歌曲之间的差异性，为歌曲段落的定位带来了很多困难，目前亟需能够对歌曲进行精确分段并确定各段落的起止时间点的方案。

发明内容

本发明实施例提供一种音频分段方法、装置、存储介质及电子设备，旨在实现对音频进行精确分段并确定各段落的起止时间点。

本发明实施例提供一种音频分段方法，包括：

将目标音频划分为多个音频片段，并提取每个音频片段的音频特征；

根据预设特征提取算法从对应的音频特征中，提取每一音频片段的第一特征向量；

将所述第一特征向量输入预设分类模型，以确定每一音频片段的初始段落类型；