[发明专利]语音文件的LRC时间轴文件自动生成方法及相关设备有效
申请号: | 201710042000.1 | 申请日: | 2017-01-20 |
公开(公告)号: | CN106897379B | 公开(公告)日: | 2019-12-03 |
发明(设计)人: | 涂继宏 | 申请(专利权)人: | 广东小天才科技有限公司 |
主分类号: | G06F16/44 | 分类号: | G06F16/44;G10L21/02 |
代理公司: | 44381 广州德科知识产权代理有限公司 | 代理人: | 万振雄<国际申请>=<国际公布>=<进入 |
地址: | 523859 广东省东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 文件 lrc 时间 自动 生成 方法 相关 设备 | ||
1.一种语音文件的LRC时间轴文件自动生成方法,其特征在于,包括:
当没有处理完所有的语音文件时,获取未经处理的语音文件及相应的录音稿文件;
按照所述语音文件的语句间隔将所述语音文件分成多个语音区间,并记录每个语音区间的开始时间;
依据语音识别技术识别所述语音文件,生成与所述语音文件对应的文本文件,其中,所述文本文件记录与所述语音区间对应的开始时间;
将所述文本文件与所述录音稿文件进行对比,并生成LRC时间轴文件;
所述将文本文件与所述录音稿文件进行对比,并生成LRC时间轴文件,包括:
判断是否已经读取完所述录音稿文件的文本或者已经读取完文本文件的文本,如果没有读取完,则按预设的单位长度依次读取所述录音稿文件的文本,并将读取的文本与所述文本文件的语音区间对应的文本进行对比,若相似度小于预设的阀值,则读取文本文件的下一个单位长度文本并与录音稿文件进行对比,直到相似度达到预设的阀值;再将所述语音区间对应的文本的开始时间与读取的录音稿文件写入LRC时间轴文件;如果读取完所述录音稿文件的文本或者读取完文本文件的文本,生成整个语音文件对应的LRC时间轴文件;所述单位长度是以句号为长度,或者按照行为长度。
2.根据权利要求1所述的方法,其特征在于,所述按照所述语音文件的语句间隔将所述语音文件分成多个语音区间,并记录每个语音区间的开始时间之后,还包括:
依据语种识别技术识别出各语音区间音频发音的语言种类;
再根据识别的语言种类调用对应的语音识别接口进行语音识别,生成与所述语音文件对应的文本文件。
3.根据权利要求2所述的方法,其特征在于,所述获取未经处理的语音文件及相应的录音稿文件之后,还包括:
按预设的降噪值和音频分贝值对所述语音文件进行预处理,从而提升语音识别成文本的精度。
4.根据权利要求3所述的方法,其特征在于,所述生成LRC时间轴文件之后,还包括:
将所述语音文件与所述LRC时间轴文件加密打包生成用户设备使用的数据。
5.一种语音文件的LRC时间轴文件自动生成装置,其特征在于,包括:
获取模块,用于当没有处理完所有的语音文件时,获取未经处理的语音文件及相应的录音稿文件;
语音区间切分模块,用于按照所述语音文件的语句间隔将所述语音文件分成多个语音区间,并记录每个语音区间的开始时间;
语音识别模块,用于依据语音识别技术识别所述语音文件,生成与所述语音文件对应的文本文件,其中,所述文本文件记录与所述语音区间对应的开始时间;
LRC时间轴文件生成模块,用于将所述文本文件与所述录音稿文件进行对比,并生成LRC时间轴文件;
所述LRC时间轴文件生成模块包括:
判断单元,用于判断是否已经读取完所述录音稿文件的文本或者已经读取完文本文件的文本;
读取单元,用于当判断单元判断出没有读取完所述录音稿文件的文本或者文本文件的文本时,按预设的单位长度依次读取所述录音稿文件的文本;
对比单元,用于将读取单元读取的文本与所述文本文件的语音区间对应的文本进行对比;
时间写入单元,用于当对比单元对比出读取单元读取的文本与所述文本文件的语音区间对应的文本的相似度达到预设的阀值时,将所述语音区间对应的文本的开始时间与读取的录音稿文件写入LRC时间轴文件;所述单位长度是以句号为长度,或者按照行为长度。
6.根据权利要求5所述的装置,其特征在于,所述装置还包括:
语种识别模块,用于依据语种识别技术识别出各语音区间音频发音的语言种类。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括:
预处理模块,用于按预设的降噪值和音频分贝值对所述语音文件进行预处理,从而提升语音识别成文本的精度。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:
加密打包模块,用于将所述语音文件与所述LRC时间轴文件加密打包生成用户设备使用的数据。
9.一种用户设备,其特征在于,包括权利要求5~权利要求8任意一项所述的语音文件的LRC时间轴文件自动生成装置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东小天才科技有限公司,未经广东小天才科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710042000.1/1.html,转载请声明来源钻瓜专利网。