[发明专利]一种教学视频的虚拟切片方法有效
| 申请号: | 201810266852.3 | 申请日: | 2018-03-28 |
| 公开(公告)号: | CN108419123B | 公开(公告)日: | 2020-09-04 |
| 发明(设计)人: | 任光杰;黄海晖;张锐;韩后;林振潮;许骏 | 申请(专利权)人: | 广州市创新互联网教育研究院 |
| 主分类号: | H04N21/439 | 分类号: | H04N21/439;H04N21/8405;H04N21/845;G10L15/26 |
| 代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 余焕娜;郑浦娟 |
| 地址: | 510000 广东省广*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 教学 视频 虚拟 切片 方法 | ||
1.一种教学视频的虚拟切片方法,其特征在于,步骤如下:
步骤S1、首先从教学视频中提取出音频数据,然后由音频数据转换得到各句子文本,由各句子文本组合得到第一文本集合;
步骤S2、获取第一文本集合中每一句子文本在视频中的起始时间、结束时间和内容信息;根据第一文本集合中各句子文本的起始时间和结束时间对其中第一文本集合中的各句子文本进行合并处理,得到第二文本集合,将该第二文本集合作为初始视频切片集合;
步骤S3、针对于初始视频切片集合中的每一切片,选取出该切片的候选关键词,由所有切片的候选关键词依次组合后得到候选关键词集合;
步骤S4、针对于候选关键词集合设定滑动窗口,针对于候选关键词集合中的每一候选关键词,通过移动滑动窗口获取到与该候选关键词处于同一滑动窗口的其他候选关键词,构成该候选关键词的第三集合,通过第三集合中的各候选关键词对该候选关键词进行投票,以得到该候选关键词的投票结果;比较其中的所有候选关键词的投票结果,将投票结果最高的N个候选关键词选取出来构成关键词集合;
步骤S5、针对于初始视频切片集合中的每一切片,将该切片与关键词集合做交集,得到该切片的关键词;
步骤S6、针对于初始视频切片集合中的每一切片,若步骤S5中没有得到该切片的关键词,则分别计算该切片的候选关键词和前一有关键词的切片的候选关键词以及后一带有关键词的切片的候选关键词的向量距离,将该切片与上述和其向量距离小的切片进行合并处理,通过上述得到合并处理后的视频切片集合;
步骤S7、针对于步骤S6中得到的视频切片集合中的每一切片,从第一切片开始,根据对应关键词计算该切片或该切片所合并到的切片与后一切片之间的相似度,当该切片或该切片所合并到的切片与后一切片之间的相似度大于第一阈值时,则判断该切片或该切片所合并到的切片的结束时间与后一切片的起始时间之间的时间间隔小于第二阈值、该切片或该切片所合并到的切片的时间长度与后一切片的时间长度均小于第三阈值以及该切片或该切片所合并到的切片与后一切片中句子的总数均小于第四阈值时,则将该切片或该切片所合并到的切片合并到后一切片,以得到最终的视频切片集合。
2.根据权利要求1所述的教学视频的虚拟切片方法,其特征在于,所述步骤S1中,采用FFMPEG开源框架从MP4格式的教学视频提取出音频;采用语音识别方法将音频转换成JSON格式文本,从而得到各句子文本。
3.根据权利要求1所述的教学视频的虚拟切片方法,其特征在于,所述步骤S2中,得到第二文本集合的过程如下:
针对于第一文本集合中的每一句子文本,从第二个句子文本开始,判断该句子文本的起始时间和前一句子文本的结束时间之间的时间间隔是否小于第二阈值时,若是,则将该句子文本与前一句子文本进行合并,或者将该句子文本合并到前一句子文本所合并到的句子文本中;同时,针对于第一文本集合中的每一句子文本,从第一个句子文本开始,判断该句子文本或该句子文本所合并到的句子文本的时间长度是否小于第三阈值时,若是,则将其合并到后一句子文本中。
4.根据权利要求1所述的教学视频的虚拟切片方法,其特征在于,所述步骤S3中,针对于初始视频切片集合中的每一切片,选取出该切片的候选关键词的具体过程如下:首先将该切片对应句子文本进行分词和词性标注,然后过滤掉其中的停用词,最后选取出词性为名词、动词、形容词、副词的词集合作为该切片的候选关键词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州市创新互联网教育研究院,未经广州市创新互联网教育研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810266852.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种电视节目导航方法及装置
- 下一篇:一种音频处理方法





