[发明专利]一种文本增强方法及装置、计算机装置、可读存储介质有效
申请号: | 201710648152.6 | 申请日: | 2017-08-01 |
公开(公告)号: | CN107424137B | 公开(公告)日: | 2020-06-19 |
发明(设计)人: | 黄忠强 | 申请(专利权)人: | 深信服科技股份有限公司 |
主分类号: | G06T5/00 | 分类号: | G06T5/00 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 王仲凯 |
地址: | 518055 广东省深圳市南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 增强 方法 装置 计算机 可读 存储 介质 | ||
本发明实施例公开了一种文本增强方法及装置、计算机装置、可读存储介质,用于改善图像上文本的显示效果的同时,可以减小图像的画面失真。本发明实施例方法包括:提取当前帧图像的文字区域;确定文字区域的第一像素点的第一像素信息;获取在第一像素点的预设范围内的第二像素点的第二像素信息;根据第二像素信息对第一像素信息进行调整。
技术领域
本发明涉及互联网技术领域,尤其涉及一种文本增强方法及装置、计算机装置、可读存储介质。
背景技术
传统视频编码技术主要针对自然图像设计,并不适用于屏幕内容编码。这主要体现在以下两点上:
1、人眼对亮度和色度的感受程度不同,对自然图像来说,一定的色度信息丢失对视觉影响并不大。而且还能够减小待编码的数据量。因此,视频编码多采用YUV420格式。但屏幕内容是干净且没有噪声的,YUV420格式的色度丢失会严重损害屏幕的画质,引起文字之类的模糊。
2、视频编码技术如H.264编码等,多采用变换操作将图像从空间域变换到频域,然后进行量化来削弱高频信号,但由于文字边缘锐利,高频信号较多。因此,这些操作会引起文字模糊。
文本增强技术是通过对图片进行处理来增强文本的显示效果,可以用来解决视频编码所导致的模糊。传统的文本增强方法主要有二值化处理、图像锐化、图像去噪、对比度增强等,这些方法主要针对扫描图像或者带文本的视频图像,增强后的图像与原始图像差距太大,但无法应用到屏幕内容的文本增强上。
发明内容
本发明实施例提供了一种文本增强方法及装置、计算机装置、可读存储介质,用于改善图像上文本的显示效果的同时,可以减小图像的画面失真。
有鉴于此,本发明第一方面提供一种文本增强方法,可包括:
提取当前帧图像的文字区域;
确定文字区域的第一像素点的第一像素信息;
获取在第一像素点的预设范围内的第二像素点的第二像素信息;
根据第二像素信息对第一像素信息进行调整。
进一步的,第一像素信息包括第一像素点的第一三色值,第二像素信息包括第二像素点的第二三色值。
进一步的,在获取在第一像素点的预设范围内的第二像素点的第二像素信息之前,方法还包括:
检测第一三色值中的至少两个值是否位于同一阈值范围;
若否,则触发获取在第一像素点的预设范围内的第二像素点的第二像素信息。
进一步的,获取第一像素点的预设范围内的第二像素点的第二三色值包括:
获取在第一像素点的邻域范围内的第二像素点的第二像素信息。
进一步的,根据第二像素信息对第一像素信息进行调整包括:
分别确定第二三色值中R值的最大值与最小值、G值的最大值与最小值、B值的最大值与最小值;
根据R值的最大值与最小值、G值的最大值与最小值、B值的最大值与最小值,对第一三色值进行调整。
进一步的,根据R值的最大值与最小值、G值的最大值与最小值、B值的最大值与最小值,对第一三色值进行调整包括:
根据R值的最大值与最小值、G值的最大值与最小值、B值的最大值与最小值,将第一三色值按照线性插值算法进行计算,得到第三三色值;
将第一像素点的第一三色值更新为第三三色值,得到新文字区域。
进一步的,在将第一像素点的第一三色值更新为第三三色值,得到新文字区域之后,方法还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深信服科技股份有限公司,未经深信服科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710648152.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种医院空气品质综合监控装置
- 下一篇:一种卫生间排风系统