[发明专利]一种针对光字符识别的码率设置方法、设备及存储介质有效
申请号: | 202010116219.3 | 申请日: | 2020-02-25 |
公开(公告)号: | CN111314697B | 公开(公告)日: | 2021-10-15 |
发明(设计)人: | 张昊;傅枧根;钟培雄 | 申请(专利权)人: | 中南大学 |
主分类号: | H04N19/124 | 分类号: | H04N19/124;H04N19/132;H04N19/146;H04N19/426;G06K9/00 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 肖云 |
地址: | 410000 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 针对 字符 识别 设置 方法 设备 存储 介质 | ||
本发明公开了一种针对光字符识别的码率设置方法、设备及存储介质,本方法首先对图片进行下采样,其次对下采样图片进行多次编码求取使得下采样图片能够被正确识别的最优QP/Rate值(最低的码率值/量化系数值),然后根据置信度神经网络求取码率增加量M/量化系数增加量N,最后快速找到针对该原始图片的最优编码值,该最优编码值是使得原始图片的光字符识别精度不受影响的最低码率值/最低量化系数值。相较于现有技术,本发明不仅可以减少网络传输带宽,而且针对大量数以亿计的图片也可以减少存储空间的占用而减少成本。而且本发明涵盖了主流的混合编码架构的应用场景,可以采用任意一种图像编码标准或者视频编码标准的帧内编码方式,应用广泛。
技术领域
本发明涉及视频编码技术和深度学习技术领域,特别涉及一种针对光字符识别的码率设置方法、设备及存储介质。
背景技术
随着人工智能技术的不断发展进步,基于移动端采集数据并进行简单的处理,然后传达运动进行智能分析已经普及。其中人脸识别、光学字符识别已经得到广泛应用。大量图像的传输会耗费大量带宽,为了节省数据网络带宽,需要对图像数据进行码率(Rate)设置,图片的码率最小(从而消耗的带宽最少)且图片质量影响最小,使得光字符识别(即OCR)效果较好。另外,即使是不需要网络传输,直接在云端或本地服务器进行OCR的应用场景中,数以亿计的图片也会占用大量存储空间。为了降低图片存储空间而减少成本,也有必要通过图片快速编码的方式对图片大小进行控制,尽量采用小的码率(即图片的体积尽量小)使得不影响光字符识别效果。
传统常用的图像编码方法有JPEG,JPEG2000等。近些年,视频编码标准的帧内编码方法也可用于图像编码,取得了比JPEG等传统方法更好的编码效率。其中,H.264、HEVC、VVC、AVS2、AVS3、AV1等一系列标准采用了混合编码架构,主要针对视频编码,但是它们的帧内编码也逐渐被应用在图像编码上。目前,在众多编码标准中如何保证光字符识别的准确率的前提下,尽量降低图片码率也是仍待解决的问题。
发明内容
本发明的目的在于至少解决现有技术中存在的技术问题之一,提供了一种针对光字符识别的码率设置方法、设备及存储介质。
根据本发明的实施例,提供了一种针对光字符识别的码率设置方法,包括以下步骤:
设置原始图片的Rate区间,对所述原始图片进行下采样,得到下采样图片;
在所述Rate区间内求取所述下采样图片的最优Rate值,所述最优Rate值为所述Rate区间内满足以下条件的最小值:基于所述最优Rate值对所述下采样图片进行编码,并在解码后能被正确识别;
将所述下采样图片输入至置信度神经网络中,并进行置信度预测,得到码率增加量M;
将所述最优Rate值加上n个所述码率增加量M设置为所述原始图片的最优编码值,所述n的取值满足以下条件:基于所述最优Rate值加上n个所述码率增加量M对所述原始图片进行编码,并在解码后能被正确识别、以及基于所述最优Rate值加上n+1个所述码率增加量M对所述原始图片进行编码,并在解码后不能被正确识别。
本发明实施例提供的一种针对光字符识别的码率设置方法,至少具有以下有益效果:
(1)本方法首先对图片进行下采样,其次对下采样图片进行多次编码求取使得下采样图片能够被正确识别的最优Rate值(最低的码率值),然后根据置信度神经网络求取码率增加量M,最后根据最优Rate值和码率增加量M快速找到针对该原始图片的最优编码值,该最优编码值是使得原始图片的光字符识别精度不受影响的最低码率值。相较于现有技术,本方法降低了编码的时间消耗。
(2)本方法不仅可以减少网络传输带宽,而且针对大量数以亿计的图片也可以减少存储空间的占用而减少成本。
(3)本方法涵盖了主流的混合编码架构的应用场景,可以采用任意一种图像编码标准或者视频编码标准的帧内编码方式,应用广泛。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010116219.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种图像垂直滤波处理的方法及芯片
- 下一篇:硅基IV族合金条及其制备方法