[发明专利]一种视频字幕实时生成系统及生成方法有效
申请号: | 201911422039.1 | 申请日: | 2019-12-31 |
公开(公告)号: | CN111107284B | 公开(公告)日: | 2022-09-06 |
发明(设计)人: | 宁乐飞;陈天萍;陈文杰;蔡佳良;阚小优 | 申请(专利权)人: | 洛阳乐往网络科技有限公司 |
主分类号: | H04N5/278 | 分类号: | H04N5/278;H04N21/439 |
代理公司: | 洛阳九创知识产权代理事务所(普通合伙) 41156 | 代理人: | 炊万庭 |
地址: | 471000 河南省洛阳市涧西区中国(河南)自*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视频 字幕 实时 生成 系统 方法 | ||
1.一种视频字幕实时生成方法,基于一种视频字幕实时生成系统,系统包括:
声音静默采集装置,与视频播放设备电性连接,用于从视频播放设备获取声音原始电信号;
前端处理装置,与所述声音静默采集装置和视频播放设备均电性连接,用于对声音原始电信号进行处理生成声音压缩电信号;
远端服务器,与所述前端处理装置电性连接,用于根据声音压缩电信号生成字幕数据并且通过前端处理装置将字幕数据发送给视频播放设备;
其特征在于,所述方法包括如下步骤:
S1、判断所述声音静默采集装置的状态,若声音静默采集装置就绪,则执行S2,否则结束;
S2、启动视频播放设备并且播放视频;
S3、声音静默采集装置通过内录方式从视频播放设备获取声音原始电信号,并且将声音原始电信号发送给所述前端处理装置;
S4、前端处理装置依次对声音原始电信号进行抽样、前处理和重采样得到声音压缩电信号,并且将声音压缩电信号发送给所述远端服务器;
S4中,抽样的具体方法为:
S4.11、将声音原始电信号分解为若干个连续的数据元,每N个数据元组成一组,每组数据元中抽取一个作为样本集;
S4.12,将样本集转化为时域信号,每N个信号为一组,每组信号中抽取一个作为初始样本D;
S4.13、计算除了初始样本D之外其余(N-1)个信号的绝对值之和SUM,并且计算
S4.14、若|D|≥
S4.15、重复执行S4.11至S4.14直到将声音原始电信号处理完毕得到声音一次电信号;
S5、远端服务器对声音压缩电信号进行识别得到字幕数据,并且将字幕数据发送给前端处理装置;
S6、前端处理装置将字幕数据发送给视频播放设备;
S7、视频播放设备在视频字幕区显示字幕数据。
2.如权利要求1所述的方法,其特征在于,所述前端处理装置包括电性连接的核心处理器和通信模块,其中核心处理器与所述声音静默采集装置电性连接,通信模块与所述远端服务器电性连接。
3.如权利要求1所述方法,其特征在于,S1的具体方法为:
S1.1、检测所述声音静默采集装置与视频播放设备的连接状态,若连接正常则执行S1.2,否则直接结束;
S1.2、检测声音静默采集装置的运行状况,若运行正常则执行S2,否则直接结束。
4.如权利要求1所述方法,其特征在于,S3中,所述声音静默采集装置每经过40ms向所述前端处理装置发送一次声音原始电信号并且清空缓存。
5.如权利要求4所述方法,其特征在于,S4中,在执行S4.11之前对声音原始电信号进行抗混叠滤波处理。
6.如权利要求4所述方法,其特征在于,S4中,前处理的具体方法为:
S4.21、按照20ms为一帧的方式将声音一次电信号分解为若干帧数据;
S4.22、利用汉明窗或者汉宁窗对每帧数据进行平滑处理;
S4.23、利用低通滤波算法对平滑处理后的数据进行抗混叠滤波处理。
7.如权利要求1所述方法,其特征在于,S4中,重采样后的频率为16000HZ、量化位数为16bit。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于洛阳乐往网络科技有限公司,未经洛阳乐往网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911422039.1/1.html,转载请声明来源钻瓜专利网。