[发明专利]一种歌词文件生成方法及装置在审
| 申请号: | 202110192245.9 | 申请日: | 2021-02-19 |
| 公开(公告)号: | CN112906369A | 公开(公告)日: | 2021-06-04 |
| 发明(设计)人: | 戴俊宇;宋旭晨;孔秋强;王雨轩 | 申请(专利权)人: | 脸萌有限公司 |
| 主分类号: | G06F40/205 | 分类号: | G06F40/205;G06F16/35;G06N3/04;G10L25/24;G10L25/30;G10L25/51 |
| 代理公司: | 北京开阳星知识产权代理有限公司 11710 | 代理人: | 唐博 |
| 地址: | 英属开*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 歌词 文件 生成 方法 装置 | ||
本发明实施例提供了一种歌词文件生成方法及装置,涉及音频处理技术领域。该方法包括:获取歌曲的音素传播序列和歌曲的音频帧序列;音素传播序列包括歌曲的歌词文本中的文本单元对应的音素;在音频帧序列中确定与文本单元对应的音频帧;文本单元对应的音素与音频帧的音频特征是相匹配的;根据音频帧的播放时长,确定文本单元的时间信息;根据文本单元与时间信息之间的对应关系,生成歌曲的歌词文件,歌词文件,用于指示在歌曲播放到时间信息所指示的位置的情况下展示文本单元。本发明实施例用于解决歌词文件生成效率较低的问题。
技术领域
本发明涉及音频处理技术领域,尤其涉及一种歌词文件生成方法及装置。
背景技术
歌曲是一种将文本和曲谱相结合的艺术形式。由于歌曲能够给人们带来全方位的听觉享受,丰富人类的感情,因此歌曲已成为一种必不可少的大众娱乐方式。
目前,每天都有大量的歌曲被创作出来。对于音乐播放平台而言,这些井喷式出现的新歌曲往往只有与歌曲对应的歌词文本,想要获得与歌曲的歌词文件,还需要获得歌曲播放时每个字的显示时间,通过每个字的显示时间与文本一起生成播放平台可用的歌词文件,从而在歌曲播放过程中实时显示与音频内容对应的文本。目前业界生成歌词文件的主要方式为人工生成。即,人工获取歌曲播放时音频输出每个字的时间信息,并根据获得的时间信息手动设置与歌词文件对应的文本中各个文本的显示时间,从而生成歌曲的歌词文件。然而,这种人工生成歌词文件的方式耗时耗力,效率极低。
发明内容
有鉴于此,本发明提供了一种歌词文件生成方法及装置,用于解决现有技术中歌词文件生成效率较低的问题。
为了实现上述目的,本发明实施例提供技术方案如下:
第一方面,本发明的实施例提供一种歌词文件生成方法,包括:
获取歌曲的音素传播序列和所述歌曲的音频帧序列;所述音素传播序列包括所述歌曲的歌词文本中的文本单元对应的音素;
在所述音频帧序列中确定与所述文本单元对应的音频帧;其中,所述文本单元对应的音素与所述音频帧的音频特征是相匹配的;
根据所述音频帧的播放时长,确定所述文本单元的时间信息;
根据所述文本单元的时间信息,生成所述歌曲的歌词文件,其中,所述歌词文件,用于指示在所述歌曲播放到所述时间信息所指示的位置的情况下展示所述文本单元。
作为本发明实施例一种可选的实施方式,所述获取歌曲的音素传播序列,包括:
基于发声词典获取所述文本单元对应的音素集合;所述发声词典包括所述文本单元与音素集合的对应关系,所述文本单元对应的音素集合为所述文本单元的各个读音对应的音素组成的集合;
根据所述文本单元在所述歌曲中的读音,从所述文本单元对应的音素集合中获取所述文本单元对应的音素;
根据所述文本单元对应的音素生成所述音素传播序列。
作为本发明实施例一种可选的实施方式,所述获取歌曲的音素传播序列,包括:
基于发声词典获取所述文本单元对应的音素集合;所述发声词典包括所述文本单元与音素集合的对应关系,所述文本单元对应的音素集合为所述文本单元的各个读音对应的音素子集组成的集合,任一读音对应的音素子集为对该读音对应的音素中的各音素的各个发音时长进行排列组合得到的集合;
根据所述文本单元在所述歌曲中的读音,从所述文本单元对应的音素集合中获取所述文本单元的目标音素子集;
根据所述文本单元在歌曲中的发音时长,从所述文本单元的目标音素子集中获取所述文本单元对应的音素;
根据所述文本单元对应的音素生成所述音素传播序列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于脸萌有限公司,未经脸萌有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110192245.9/2.html,转载请声明来源钻瓜专利网。





