[发明专利]字幕信息检测方法、装置、设备以及存储介质有效
| 申请号: | 202210356087.0 | 申请日: | 2022-04-06 | 
| 公开(公告)号: | CN114495128B | 公开(公告)日: | 2022-07-08 | 
| 发明(设计)人: | 王洪松;黄珊 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 | 
| 主分类号: | G06V30/40 | 分类号: | G06V30/40;G06V20/40;G06V20/62;G06V30/19;G06K9/62;G06F40/194;G06F40/258;G06F40/30;G06F40/58;G06N3/04;G06N3/08 | 
| 代理公司: | 北京市立方律师事务所 11330 | 代理人: | 张筱宁 | 
| 地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 字幕 信息 检测 方法 装置 设备 以及 存储 介质 | ||
1.一种字幕信息检测方法,其特征在于,所述方法包括:
确定目标视频的每个视频帧中的各文本框,基于各所述文本框确定至少一个文本框序列,每个所述文本框序列中的任意两个文本框位于不同的视频帧;
确定所述目标视频对应的每个音频片段对应的文本内容;
基于每个所述文本框序列以及对应的第一时间区间、各所述音频片段对应的第二时间区间和文本内容,确定每个所述文本框序列与各所述音频片段的匹配度;
基于每个所述文本框序列与各所述音频片段的匹配度,从各所述文本框序列中确定出包括字幕信息的目标文本框序列;
基于各所述目标文本框序列确定所述目标视频的字幕信息。
2.根据权利要求1所述的方法,其特征在于,所述基于各所述文本框确定至少一个文本框序列,包括:
确定各所述文本框中每两个文本框的文本框相似度;
基于各所述文本框中每两个文本框的文本框相似度,从各所述文本框中确定出至少一个文本框序列,每个所述文本框序列中的文本框按照所在视频帧的帧序号由小到大的顺序进行排列;
其中,对于每个所述文本框序列中任意两个相邻的第一文本框和第二文本框,所述第一文本框之后的所述第二文本框是基于以下方式确定的:
确定所述第一文本框所在视频帧之后的第一数量的视频帧中的第一视频帧,每个所述第一视频帧包括与所述第一文本框的文本框相似度大于第一阈值的文本框;
将帧序号最小的第一视频帧中与所述第一文本框的文本框相似度最大的文本框确定为所述第二文本框。
3.根据权利要求2所述的方法,其特征在于,对于各所述文本框中的任意两个不相同的第三文本框和第四文本框,确定所述第三文本框和所述第四文本框的文本框相似度,包括:
响应于所述第三文本框和所述第四文本框所在视频帧的帧序号差小于或者等于第一数量、且所述第三文本框和所述第四文本框位于不同的视频帧,基于所述第三文本框和所述第四文本框分别对应的文本内容、以及分别在对应视频帧中的第一区域和第二区域,确定所述第三文本框和所述第四文本框的文本框相似度。
4.根据权利要求3所述的方法,其特征在于,所述基于所述第三文本框和所述第四文本框分别对应的文本内容、以及分别在对应视频帧中的第一区域和第二区域,确定所述第三文本框和所述第四文本框的文本框相似度,包括:
确定所述第三文本框和所述第四文本框分别对应的文本内容的第一文本相似度;
确定所述第三文本框和所述第四文本框分别在对应视频帧中的第一区域和第二区域的交集区域和并集区域,并确定所述交集区域和所述并集区域的区域交并比;
基于所述第一文本相似度和所述区域交并比,确定所述第三文本框和所述第四文本框的文本框相似度。
5.根据权利要求1所述的方法,其特征在于,对于每个所述文本框序列和每个所述音频片段,基于该文本框序列以及对应的第一时间区间、该音频片段对应的第二时间区间和文本内容,确定该文本框序列与该音频片段的匹配度,包括:
确定该文本框序列对应的第一时间区间和该音频片段对应的第二时间区间的时间交集;
基于该文本框序列对应的文本内容,确定该文本框序列在所述时间交集内的第一文本内容,基于该音频片段对应的文本内容,确定该音频片段在所述时间交集的第二文本内容;
基于所述第一文本内容和所述第二文本内容,确定该文本框序列与该音频片段的匹配度。
6.根据权利要求5所述的方法,其特征在于,所述基于所述第一文本内容和所述第二文本内容,确定该文本框序列与该音频片段的匹配度,包括:
确定所述第一文本内容的第一文本长度、以及所述第二文本内容的第二文本长度;
确定所述第一文本内容和所述第二文本内容的第二文本相似度;
基于所述第二文本相似度、所述第一文本长度以及所述第二文本长度,确定该文本框序列与该音频片段的匹配度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210356087.0/1.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置





