[发明专利]基于图像识别的药品名称识别方法及系统在审
申请号: | 201910787273.8 | 申请日: | 2019-08-25 |
公开(公告)号: | CN110599512A | 公开(公告)日: | 2019-12-20 |
发明(设计)人: | 赵昊辰;何新;马轩;姜楠;何毅;王建宇;杨诚 | 申请(专利权)人: | 南京理工大学 |
主分类号: | G06T7/13 | 分类号: | G06T7/13;G06T7/11;G06T5/30;G06K9/34;G06K9/20;G06T7/194 |
代理公司: | 32203 南京理工大学专利中心 | 代理人: | 陈鹏 |
地址: | 210094 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 名称位置 药盒 名称识别 图像检测 分割模块 膨胀运算 识别系统 算法确定 图像识别 种类识别 腐蚀 分割 | ||
1.一种基于图像识别的药品名称识别方法,其特征在于,包括:
药盒图像检测与分割:采用Canny算子检测药盒边缘生成边缘图像,采用Hough直线检测确定药盒的矩形边框;
药品名称位置识别:通过对图像进行腐蚀膨胀处理,将药盒的字融合成一块整体区域,通过提取区域轮廓,对轮廓进行多边形的拟合操作,用矩形将文字区域框出来;
药品名称识别:使用大津法对文字图片进行二值化,将其变成一组二值的数字信号,再通过文本切分得到单个文字图片,调用OCR识别软件识别字符图片,获取文本信息获得药品名称信息。
2.根据权利要求1所述的基于图像识别的药品种类识别方法,其特征在于,药盒图像检测与分割包括边缘检测、轮廓提取、计算药盒中心点及药盒旋转角度;边缘检测采用Canny算子经过高斯滤波、梯度计算、边缘非极大值抑制、双阈值确定边缘点、连接边缘点生成边缘图像对药盒进行初步边缘检测,轮廓提取采用Hough直线检测得到药盒矩形轮廓,最后根据所得矩形计算药盒中心点及药盒旋转角度得到规整的药盒图案。
3.根据权利要求1所述的基于图像识别的药品种类识别方法,其特征在于,所述药品名称位置识别包括药盒图片的旋转、识别药盒表面文字位置、确定药品名称位置;其中:通过药盒图片的旋转确保能得到角度正确的药名图片,对图像的腐蚀膨胀处理初步提取出药盒上的文字位置,使用MSER算法对提取出的文字区域进行检验将文字部分具体划分,利用药品名称的特点确定药品名称位置。
4.根据权利要求1所述的基于图像识别的药品种类识别方法,其特征在于,药品名称识别包括文字颜色识别、图像二值化、文本切分、OCR文字识别,其中:文字颜色识别为二值化提供预处理,若文字颜色为黑色,则直接进行二值化操作,若文字颜色为白色,则反转图片再进行二值化操作,二值化算法选用大津法,区分文字和文字背景;采用投影法进行文本切分得到单个文字,再调用OCR识别软件识别字符图片,获取文本信息。
5.一种基于图像识别的药品名称识别系统,其特征在于,包括药盒图像检测与分割模块、药品名称位置识别模块和药品名称识别模块;其中:
药盒图像检测与分割模块,用于对图像进行预处理:采用Canny算子检测药盒边缘生成边缘图像,采用Hough直线检测确定药盒的矩形边框;
药品名称位置识别模块,用于确定药品名称位置:通过对图像进行腐蚀膨胀处理,将药盒的字融合成一块整体区域,通过提取区域轮廓,对轮廓进行多边形的拟合操作,用矩形将文字区域框出来;
药品名称识别模块使用大津法对文字图片进行二值化,将其变成一组二值的数字信号,再通过文本切分得到单个文字图片,调用OCR识别软件识别字符图片,获取文本信息获得药品名称信息。
6.根据权利要求5所述的基于图像识别的药品种类识别系统,其特征在于:所述的药盒图像检测与分割模块用于边缘检测、轮廓提取、计算药盒中心点及药盒旋转角度;其中:边缘检测采用Canny算子经过高斯滤波、梯度计算、边缘非极大值抑制、双阈值确定边缘点、连接边缘点生成边缘图像对药盒进行初步边缘检测,轮廓提取采用Hough直线检测得到药盒矩形轮廓,最后根据所得矩形计算药盒中心点及药盒旋转角度得到规整的药盒图案。
7.根据权利要求5所述的基于图像识别的药品种类识别系统,其特征在于:所述药品名称位置识别模块用于药盒图片的旋转、识别药盒表面文字位置、确定药品名称位置;其中:通过药盒图片的旋转确保能得到角度正确的药名图片,对图像的腐蚀膨胀处理初步提取出药盒上的文字位置,使用MSER算法对提取出的文字区域进行检验将文字部分具体划分,利用药品名称的特点确定药品名称位置。
8.根据权利要求5所述的基于图像识别的药品种类识别系统,其特征在于:所述药品名称识别模块用于文字颜色识别、图像二值化、文本切分、OCR文字识别;文字颜色识别为二值化提供预处理,若文字颜色为黑色,则直接进行二值化操作,若文字颜色为白色,则反转图片再进行二值化操作,二值化算法选用大津法;采用投影法进行文本切分得到单个文字,再调用OCR识别软件识别字符图片,获取文本信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910787273.8/1.html,转载请声明来源钻瓜专利网。