[发明专利]一种音频获取方法及装置在审
申请号: | 201711093678.9 | 申请日: | 2017-11-08 |
公开(公告)号: | CN107863112A | 公开(公告)日: | 2018-03-30 |
发明(设计)人: | 郭建辉 | 申请(专利权)人: | 天脉聚源(北京)传媒科技有限公司 |
主分类号: | G10L25/78 | 分类号: | G10L25/78;G10L25/87;G10L25/57 |
代理公司: | 北京尚伦律师事务所11477 | 代理人: | 张亮 |
地址: | 100007 北京市东城区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 音频 获取 方法 装置 | ||
1.一种音频获取方法,其特征在于,包括:
获取录制的TS碎片视频;
从所述TS碎片视频中提取音频数据;
根据所述音频数据的静音长度确定语句结束位置;
根据所述语句结束位置,获取目标音频数据。
2.根据权利要求1所述的方法,其特征在于,在从所述TS碎片视频中提取音频数据之前,所述方法还包括:
将预设数目个TS碎片视频进行合并。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
将所述语句结束位置之后的剩余语音与下一相邻预设数目个TS碎片视频的音频数据进行合并。
4.根据权利要求1至3中任一项所述的方法,其特征在于,
所述根据所述音频数据的静音长度确定语句结束位置,包括:
当所述音频数据的静音长度达到预设静音时长时,将不超过预设音频时长所述音频数据的静音开始位置确定为所述语句结束位置。
5.一种音频获取位置,其特征在于,包括:
第一获取模块,用于获取录制的TS碎片视频;
提取模块,用于从所述TS碎片视频中提取音频数据;
确定模块,用于根据所述音频数据的静音长度确定语句结束位置;
第二获取模块,用于根据所述语句结束位置,获取目标音频数据。
6.根据权利要求5所述的位置,其特征在于,所述位置还包括:
第一合并模块,用于在从所述TS碎片视频中提取音频数据之前,将预设数目个TS碎片视频进行合并。
7.根据权利要求6所述的位置,其特征在于,所述位置还包括:
第二合并模块,用于将所述语句结束位置之后的剩余语音与下一相邻预设数目个TS碎片视频的音频数据进行合并。
8.根据权利要求5至7中任一项所述的位置,其特征在于,
所述确定模块包括:
确定子模块,用于当所述音频数据的静音长度达到预设静音时长时,将不超过预设音频时长所述音频数据的静音开始位置确定为所述语句结束位置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天脉聚源(北京)传媒科技有限公司,未经天脉聚源(北京)传媒科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711093678.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:面向交互的语音语料处理方法及装置
- 下一篇:一种语音上传方法及装置