[发明专利]一种字幕纠正方法、字幕显示方法、装置、设备及介质有效
| 申请号: | 202010881048.3 | 申请日: | 2020-08-27 |
| 公开(公告)号: | CN111968649B | 公开(公告)日: | 2023-09-15 |
| 发明(设计)人: | 陈小帅 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
| 主分类号: | G10L15/26 | 分类号: | G10L15/26;H04N21/233;H04N21/235 |
| 代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 梁嘉琦 |
| 地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 字幕 纠正 方法 显示 装置 设备 介质 | ||
1.一种字幕纠正方法,其特征在于,包括:
获取视频数据中的音频流数据和视频画面数据;
对所述音频流数据进行语音识别,得到第一字幕信息;
对所述视频画面数据进行文本识别;
根据所述文本识别的结果对所述第一字幕信息进行纠正,得到第二字幕信息;
其中,所述对所述视频画面数据进行文本识别,包括:
对所述视频画面数据中的画面内容进行文本识别,得到视频内容文本;
对所述视频内容文本进行第一分词,并从所述第一分词的结果中确定视频内容词表,所述视频内容词表中任意词条的词频大于预设阈值;
根据所述视频内容词表,构建视频内容词库;
根据所述视频内容词库,构建查询索引;
其中,所述根据所述文本识别的结果对所述第一字幕信息进行纠正,得到第二字幕信息,包括:
对所述第一字幕信息进行第二分词;
根据所述第二分词的结果构建连续词片段;
根据所述查询索引,在所述视频内容词库中确定所述连续词片段对应的初始纠正候选词;
根据所述初始纠正候选词的置信度,确定目标纠正候选词;
通过所述目标纠正候选词对所述第一字幕信息进行纠正,得到第二字幕信息;
其中,所述根据所述初始纠正候选词的置信度,确定目标纠正候选词,包括:
根据候选相似度、初始纠正候选词在所述视频内容词库中的语言模型概率以及候选词片段个数减少量,确定所述初始纠正候选词的置信度;
根据所述初始纠正候选词的置信度,将所述初始纠正候选词中满足第一预设条件的初始纠正候选词确定为目标纠正候选词。
2.根据权利要求1所述的一种字幕纠正方法,其特征在于,所述根据所述视频内容词表,构建视频内容词库,包括:
确定所述视频内容词表中所有词条的语言模型概率;其中,所述语言模型概率包括所述视频内容词表中每个词条的一元概率和若干个词条之间的多元概率,所述若干个词条包括至少两个词条;
根据所述一元概率和所述多元概率,构建得到视频内容词库。
3.根据权利要求1所述的一种字幕纠正方法,其特征在于,所述根据所述视频内容词库,构建查询索引,包括:
对所述视频内容词库中词条进行拼音注音,得到所述词条的全拼信息和简拼信息;
根据所述全拼信息和该全拼信息对应的词条构建第一拼音索引;
根据所述简拼信息和该简拼信息对应的词条构建第二拼音索引。
4.根据权利要求1所述的一种字幕纠正方法,其特征在于,所述根据所述视频内容词库,构建查询索引,还包括:
对所述视频内容词库中词条进行笔画拆解,得到所述词条的笔画信息;
根据所述词条的笔画信息和该笔画信息对应的词条构建笔画索引。
5.根据权利要求1所述的一种字幕纠正方法,其特征在于,所述根据所述初始纠正候选词的置信度,确定目标纠正候选词,至少包括以下步骤之一:
通过先验知识构建置信度判定规则,根据所述置信度判定规则确定所述初始纠正候选词的置信度,并确定目标纠正候选词;
构建置信标记分类模型,根据所述置信标记分类模型确定所述初始纠正候选词的置信度,并确定目标纠正候选词。
6.根据权利要求5所述的一种字幕纠正方法,其特征在于,所述通过先验知识构建置信度判定规则,根据所述置信度判定规则确定所述初始纠正候选词的置信度,并确定目标纠正候选词,包括:
确定所述初始纠正候选词的候选相似度;
确定所述初始纠正候选词在所述视频内容词库中的语言模型概率;
确定所述初始纠正候选词的候选词片段个数减少量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010881048.3/1.html,转载请声明来源钻瓜专利网。





