[发明专利]一种视频中字幕字符的识别方法及装置有效
申请号: | 202010182005.6 | 申请日: | 2020-03-16 |
公开(公告)号: | CN111414908B | 公开(公告)日: | 2023-08-29 |
发明(设计)人: | 杨杰;宋施恩;金义彬;肖恺吟;卢海波 | 申请(专利权)人: | 湖南快乐阳光互动娱乐传媒有限公司 |
主分类号: | G06V20/62 | 分类号: | G06V20/62;G06V30/148;G06V30/166;G06N3/0464;G06N3/08 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 林哲生 |
地址: | 410003 湖南省*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种视频中字幕字符的识别方法及装置,方法包括:获取原始视频帧,裁剪掉所述原始视频帧的上部预设区域,得到第一预设尺寸的待识别视频帧;将待识别视频帧输入字幕位置检测模型中进行处理,得到字幕在待识别视频帧中的位置;根据字幕在待识别视频帧中的位置,对待识别视频帧进行裁剪,并将裁剪后得到的图像的尺寸调整为第二预设尺寸得到字幕图像;将字幕图像输入字符识别模型中进行处理,由于字符识别模型是对改进后的CRNN模型训练得到的,利用改进后的CRNN模型中的densenet对字幕图像进行特征提取,提高特征提取的准确性,然后将提取的特征输入1*1卷积层,1*1卷积层相对于耗时较长的循环层处理速度较快,提高了字符识别的处理速度。 | ||
搜索关键词: | 一种 视频 字幕 字符 识别 方法 装置 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南快乐阳光互动娱乐传媒有限公司,未经湖南快乐阳光互动娱乐传媒有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202010182005.6/,转载请声明来源钻瓜专利网。
- 上一篇:一种直流电流的抑制装置
- 下一篇:一种垃圾干燥过程智能控制系统及控制方法