[发明专利]一种用于电子白板的屏幕文字提取系统及方法在审
申请号: | 202011598383.9 | 申请日: | 2020-12-29 |
公开(公告)号: | CN112686253A | 公开(公告)日: | 2021-04-20 |
发明(设计)人: | 朱玉荣;汤鹏飞 | 申请(专利权)人: | 安徽文香信息技术有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/34 |
代理公司: | 合肥洪雷知识产权代理事务所(普通合伙) 34164 | 代理人: | 徐赣林 |
地址: | 247126 安徽省池*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 电子白板 屏幕 文字 提取 系统 方法 | ||
1.一种用于电子白板的屏幕文字提取系统,其特征在于,包括文字框选模块、文本检测模块、文本特征提取模块和识别模块;
所述文本框选模块,用于在电子白板屏幕中框选处需要进行文字提取的区域,并截取成高清图片;
所述文本检测模块,用于检测高清图片中,确定文字提取区域的具体位置;
所述文本特征提取模块,用于对文字提取区域内的文字进行特征提取;
所述识别模块,用于对特征提取后的文字图片中识别出目标文字。
2.根据权利要求1所述的一种用于电子白板的屏幕文字提取系统,其特征在于,所述文本检测模块具体用于:从框选处的文本区域中,提取出文字区域的属性;所述文字区域的属性包括置信度、尺度、顶点坐标;所述置信度用于指示文字提取区域中包含文字行的概率。
3.根据权利要求1所述的一种用于电子白板的屏幕文字提取系统,其特征在于,所述文本检测模块要提前设置文本特征阈值;所述文本特征阈值包括字体大小、高度、宽度、像素点的灰度值、像素点的梯度值和字符间距。
4.一种用于电子白板的屏幕文字提取方法,其特征在于,包括如下步骤:
步骤S1:用手在电子白板屏幕上画出需要识别的候选区域;
步骤S2:对候选区域的图像进行截图获取高清图片;
步骤S3:对高清图像中的文本进行定位;
步骤S4:使用二值化法将图像中的文本与背景进行分离;
步骤S5:对分离后的文字图像进行边缘检测和细分割;
步骤S6:对文字区域进行检验筛选识别出最终的文字。
5.根据权利要求4所述的一种用于电子白板的屏幕文字提取方法,其特征在于,所述步骤S1中,将电子白板屏幕的左下角作为坐标系原点,建立空间坐标系;选择电子白板屏幕上的任意一点作为图像截取的起点,手指在电子白板上滑动,当手指离开电子白板时,获取终点坐标;结合起点和终点坐标,获得候选区域。
6.根据权利要求4所述的一种用于电子白板的屏幕文字提取方法,其特征在于,所述步骤S3中,文本定位通过连通域分析和滑动窗口分类法进行图像中文本的定位。
7.根据权利要求4所述的一种用于电子白板的屏幕文字提取方法,其特征在于,所述步骤S5中,边缘检测采用Prewitt算子,先求出图像中各个像素的R、G、B三分量,在将三分量代入Prewitt算子求彩色欧式距离;把彩色图像I(i,j)转化为了边缘灰度图像S(i,j),用迭代法求阈值T,将S(i,j)进行二值化处理;当S(i,j)小于T时,认为像素点(i,j)为背景点,将像素值设为0;当S(i,j)大于T时,认为像素点(i,j)为边缘点,将像素值设为1。
8.根据权利要求4所述的一种用于电子白板的屏幕文字提取方法,其特征在于,所述步骤S6中,对文字图像进行细分割时,对边缘图进行行扫描,累计每行边缘点Ei,当Ei大于0,则行为文字行;
当Ei等于0,则行为背景行;
连续出现文字行,则认为该区域为文字区域,连续出现背景行;
则认为该区域为背景区域。
9.根据权利要求8所述的一种用于电子白板的屏幕文字提取系统及方法,其特征在于,所述文字区域的像素点不小于六个像素,若认定的文字区域小于六个像素,则将该文字区域,认定为噪声。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽文香信息技术有限公司,未经安徽文香信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011598383.9/1.html,转载请声明来源钻瓜专利网。