[发明专利]一种基于手动拍照的化验单识别方法在审
申请号: | 201710149906.3 | 申请日: | 2017-03-14 |
公开(公告)号: | CN106991416A | 公开(公告)日: | 2017-07-28 |
发明(设计)人: | 尹建伟;王宸敏;邓水光;李莹;吴健;吴朝晖;章笠中 | 申请(专利权)人: | 浙江大学;医惠科技有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/46 |
代理公司: | 杭州天勤知识产权代理有限公司33224 | 代理人: | 马士林 |
地址: | 310013 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 手动 拍照 化验单 识别 方法 | ||
1.一种基于手动拍照的化验单识别方法,包括如下步骤:
(1)对化验单图像进行预处理;
(2)对预处理后的化验单图像进行切割分栏,以提取有效内容列;
(3)将所述的有效内容列逐个输入至开源引擎Tesseract中,得到有效内容列所对应的文本信息;
(4)对所述的文本信息进行纠错处理。
2.根据权利要求1所述的化验单识别方法,其特征在于:所述步骤(1)中对化验单图像进行预处理的过程如下:
1.1将化验单图像转换为灰度图后进行去噪处理;
1.2对去噪处理后的化验单图像进行二值化;
1.3对二值化后的化验单图像进行抗扭斜处理。
3.根据权利要求2所述的化验单识别方法,其特征在于:所述步骤1.1中采用高斯模糊去噪算法对灰度图进行去噪处理。
4.根据权利要求2所述的化验单识别方法,其特征在于:所述步骤1.2中的二值化过程为:初始化设定一个灰度阈值t,根据灰度阈值t将去噪处理后的化验单图像分割成前景和背景;然后计算前景像素所占比例wf、背景像素所占比例wb、前景像素的平均灰度值avgf以及背景像素的平均灰度值avgb,通过二分法对目标函数g(t)=wf×avgf+wb×avgb进行优化求解,求解出目标函数g(t)最大化时所对应的灰度阈值t并使其作为全局最优阈值topt;最后利用全局最优阈值topt对去噪处理后的化验单图像进行分割,以实现图像二值化。
5.根据权利要求2所述的化验单识别方法,其特征在于:所述步骤1.3中的抗扭斜处理过程为:首先,对二值化后的化验单图像进行线段检测,并删除其中斜率超过一定阈值的线段;然后,对斜率相近且距离相近的线段进行合并,再删除长度小于一定阈值的线段;最后,对剩余线段的斜率取平均,按斜率平均值对二值化后的化验单图像进行偏转校正。
6.根据权利要求1所述的化验单识别方法,其特征在于:所述步骤(2)的具体实现过程如下:
2.1对预处理后的化验单图像在水平方向上进行区域分割,以得到若干个内容区域;
2.2对于任一内容区域,先忽略其位于图像顶端、底端、左侧和右侧的部分,然后检测其中每一列像素,令噪点所占比例少于一定阈值的列作为空白列,其余作为内容列;
2.3合并相邻的内容列,进而对于合并后的内容列,令宽度小于一定阈值的内容列作为无效内容列,其余作为有效内容列提取。
7.根据权利要求6所述的化验单识别方法,其特征在于:所述步骤2.1中区域分割的具体过程为:首先,对预处理后的化验单图像进行线段检测,并删除其中斜率在水平斜率区间外的线段;然后,对斜率相近且距离相近的线段进行合并,再删除长度小于一定阈值的线段;最后,根据剩余的线段对预处理后的化验单图像在水平方向上进行区域分割。
8.根据权利要求5或7所述的化验单识别方法,其特征在于:所述线段检测采用基于LSD的线段提取算法或基于Hough变换的线段提取算法。
9.根据权利要求1所述的化验单识别方法,其特征在于:所述步骤(4)的具体实现过程如下:
4.1根据历史各类化验单常规检查项,编辑建立医学词库;
4.2对于文本信息中的任一目标词,遍历计算该目标词与医学词库中所有词之间的编辑距离,取编辑距离最小的词组成该目标词的候选集;
4.3若候选集中只有一个词,则使该词作为目标词的纠错结果并进行替换;若候选集中有多个词,则找出这些词与目标词之间的区别字,遍历计算目标词与所有候选词之间关于区别字的相似度,取对应区别字相似度最大的候选词作为该目标词的纠错结果并进行替换。
10.根据权利要求9所述的化验单识别方法,其特征在于:所述步骤4.3中计算目标词与候选词之间关于区别字的相似度,具体过程为:首先,截取目标词与候选词之间区别字的字体图像,所述字体图像经二值化后分为黑白两色,黑色部分的像素标记为1,白色部分的像素标记为0;然后,统计两个区别字的字体图像中相同位置均标记为1的像素对数N,相同位置至少其中一个标记为1的像素对数M;最后,计算目标词与候选词之间关于区别字的相似度=N/M。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学;医惠科技有限公司,未经浙江大学;医惠科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710149906.3/1.html,转载请声明来源钻瓜专利网。