[发明专利]一种基于语音的视频倍速播放方法及系统有效
申请号: | 201910443874.7 | 申请日: | 2019-05-27 |
公开(公告)号: | CN110177298B | 公开(公告)日: | 2021-03-26 |
发明(设计)人: | 唐文滔;李兴平;曹问;刘维 | 申请(专利权)人: | 湖南快乐阳光互动娱乐传媒有限公司 |
主分类号: | H04N21/439 | 分类号: | H04N21/439;H04N21/44;H04N21/462;H04N21/845 |
代理公司: | 长沙正奇专利事务所有限责任公司 43113 | 代理人: | 李美丽 |
地址: | 410001 湖南省长沙市*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 语音 视频 播放 方法 系统 | ||
1.一种基于语音的视频倍速播放方法,其特征在于,
在视频文件预处理时,包括以下步骤:
步骤A,读取视频文件中的语音信息;
步骤B,对所述语音信息进行分析,根据语音信息的快慢将视频文件分解为对应的多段子视频,并获得各子视频段基于对应语音信息的倍速速率;
步骤C,利用各子视频段对应的倍速速率按照时间顺序形成倍速描述文件;
在视频文件播放时,包括以下步骤:
步骤D,加载并解析倍速描述文件;
步骤E,视频文件播放至某子视频段时,根据倍速描述文件中的该子视频段对应的倍速速率播放视频文件;
所述步骤B中,各子视频段基于语音信息的倍速速率确定方法为:根据语音信息识别结果,计算吐词速度,对比90%以上人群能够听懂的最快吐词速度,计算各子视频段的倍速速率;
或者,
所述步骤B中,各子视频段基于语音信息的倍速速率确定方法为:使用机器学习方法训练语音倍速播放模型,将语音信息识别结果输入语音倍速播放模型,获得各子视频段的倍速速率。
2.如权利要求1所述的基于语音的视频倍速播放方法,其特征在于,倍速描述文件和对应的视频文件一起分发。
3.一种基于语音的视频倍速播放系统,其特征在于,包括:
语音信息读取单元:用于在视频文件播放器读取视频文件中的语音信息;
语音信息分析单元:用于对语音信息读取单元读取的语音信息进行分析,根据语音信息的快慢将视频文件分解为对应的多段子视频,并获得各子视频段基于对应语音信息的倍速速率;
倍速描述文件形成单元:用于利用各子视频段对应的倍速速率按照时间顺序形成倍速描述文件;
播放器:用于播放视频文件,并用于加载并解析倍速描述文件;在视频文件播放至某子视频段时,根据倍速描述文件中的该子视频段对应的倍速速率播放视频文件;
所述语音信息分析单元中,根据语音信息识别结果,计算吐词速度,对比90%以上人群能够听懂的最快吐词速度,计算各子视频段的倍速速率;
或者,
所述语音信息分析单元中,使用机器学习方法训练语音倍速播放模型,将语音信息识别结果输入语音倍速播放模型,获得各子视频段的倍速速率。
4.如权利要求3所述的基于语音的视频倍速播放系统,其特征在于,倍速描述文件和对应的视频文件一起分发至播放器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南快乐阳光互动娱乐传媒有限公司,未经湖南快乐阳光互动娱乐传媒有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910443874.7/1.html,转载请声明来源钻瓜专利网。