[发明专利]不规则医疗报告单图像中敏感信息脱敏方法及系统在审
申请号: | 202111567540.4 | 申请日: | 2021-12-20 |
公开(公告)号: | CN114255465A | 公开(公告)日: | 2022-03-29 |
发明(设计)人: | 王珏 | 申请(专利权)人: | 苏州良医汇网络科技有限公司 |
主分类号: | G06V30/148 | 分类号: | G06V30/148;G06T7/70;G06T7/11;G06T3/00;G06F40/289;G06F21/62;G06V10/774;G06V10/82;G06N3/04 |
代理公司: | 苏州市中南伟业知识产权代理事务所(普通合伙) 32257 | 代理人: | 王广浩 |
地址: | 215000 江苏省苏州市工业园区*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 不规则 医疗 报告 图像 敏感 信息 方法 系统 | ||
1.一种不规则医疗报告单图像中敏感信息脱敏方法,其特征在于,包括以下步骤:
S1、利用霍夫变换对具有形变和扭曲的医疗报告单图像进行自动校正;
S2、使用训练好的DBNet模型对已校正的医疗报告单图像进行文本信息检测,得到所有文本信息的文本框位置坐标,所述文本框位置坐标为文本框四个顶点的像素位置;
S3、基于文本框位置坐标,使用训练好的CRNN模型对文本框中的文本信息进行识别,并得到相应的文本信息;
S4、基于得到的文本信息及预先设定的敏感信息范围,使用关键词匹配和THULAC词性标注,识别出文本信息中的敏感信息,并定位敏感信息区域的位置坐标;
S5、基于定位出的敏感信息区域的位置坐标,使用像素覆盖的方式对敏感信息区域进行脱敏处理。
2.如权利要求1所述的不规则医疗报告单图像中敏感信息脱敏方法,其特征在于,步骤S1包括:
S11、利用霍夫变换检测出原始医疗报告单图像中文本信息的倾斜角度;
S12、基于原始医疗报告单图像及倾斜角度,计算出仿射变换矩阵;
S13、通过仿射变换矩阵得到校正后的医疗报告单图像。
3.如权利要求1所述的不规则医疗报告单图像中敏感信息脱敏方法,其特征在于,步骤S2包括:使用训练好的DBNet模型对已校正的医疗报告单图像进行文本信息检测,得到包括医疗报告单中所有文本信息的文本框位置坐标的列表text_coor_list,列表text_coor_list中包含文本框四个顶点的像素位置。
4.如权利要求1所述的不规则医疗报告单图像中敏感信息脱敏方法,其特征在于,步骤S3包括:
S31、将已校正的医疗报告单图像列表text_coor_list输入训练好的CRNN模型;
S32、遍历列表text_coor_list,基于每个文本框四个顶点的像素位置,将医疗报告单图像中对应的区域裁剪下来输入到训练好的CRNN模型中;
S33、输出识别结果列表text_cont_list,列表text_cont_list中的每个元素的形式为[corrdinate,content,confidence],分别表示每个文本框四个顶点像素位置、文本框中的文本内容和识别置信度。
5.如权利要求4所述的不规则医疗报告单图像中敏感信息脱敏方法,其特征在于,步骤S4包括:
S41、遍历列表text_cont_list,使用THULAC对每个文本框的文本识别内容content进行分词,并标注词性,返回词性标注列表char_list;
S42、遍历词性标注列表char_list,判断当前词cur_word是否在预先设定的敏感信息集合sens_set中,如果在,则标注该词为敏感信息;如果不在,则根据词性进行进一步判断;
S43、根据已被标注为敏感信息的当前词cur_word,检索出该词在当前文本框中的索引位置text_ind和该词的长度text_len,然后根据当前文本框左上角和右下角的坐标位置,将该文本框按照汉字占两个字符,英文字母和单个数字占一个字符进行均等划分,即可确定已被标注为敏感信息的当前词cur_word在医疗报告单中的像素位置word_loc。
6.如权利要求5所述的不规则医疗报告单图像中敏感信息脱敏方法,其特征在于,步骤S42中,根据词性进行进一步判断,包括:
S421、如果当前词cur_word的词性是人名,则标注当前词为敏感信息;
S422、如果当前词cur_word的词性是地名,则标注当前词为敏感信息;
S423、如果当前词cur_word的词性是数词,则根据数词长度进行判断;
S424、如果当前词cur_word的词性是电子邮箱,则标注当前词为敏感信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州良医汇网络科技有限公司,未经苏州良医汇网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111567540.4/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序