[发明专利]不规则医疗报告单图像中敏感信息脱敏方法及系统在审

专利信息
申请号: 202111567540.4 申请日: 2021-12-20
公开(公告)号: CN114255465A 公开(公告)日: 2022-03-29
发明(设计)人: 王珏 申请(专利权)人: 苏州良医汇网络科技有限公司
主分类号: G06V30/148 分类号: G06V30/148;G06T7/70;G06T7/11;G06T3/00;G06F40/289;G06F21/62;G06V10/774;G06V10/82;G06N3/04
代理公司: 苏州市中南伟业知识产权代理事务所(普通合伙) 32257 代理人: 王广浩
地址: 215000 江苏省苏州市工业园区*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 不规则 医疗 报告 图像 敏感 信息 方法 系统
【权利要求书】:

1.一种不规则医疗报告单图像中敏感信息脱敏方法,其特征在于,包括以下步骤:

S1、利用霍夫变换对具有形变和扭曲的医疗报告单图像进行自动校正;

S2、使用训练好的DBNet模型对已校正的医疗报告单图像进行文本信息检测,得到所有文本信息的文本框位置坐标,所述文本框位置坐标为文本框四个顶点的像素位置;

S3、基于文本框位置坐标,使用训练好的CRNN模型对文本框中的文本信息进行识别,并得到相应的文本信息;

S4、基于得到的文本信息及预先设定的敏感信息范围,使用关键词匹配和THULAC词性标注,识别出文本信息中的敏感信息,并定位敏感信息区域的位置坐标;

S5、基于定位出的敏感信息区域的位置坐标,使用像素覆盖的方式对敏感信息区域进行脱敏处理。

2.如权利要求1所述的不规则医疗报告单图像中敏感信息脱敏方法,其特征在于,步骤S1包括:

S11、利用霍夫变换检测出原始医疗报告单图像中文本信息的倾斜角度;

S12、基于原始医疗报告单图像及倾斜角度,计算出仿射变换矩阵;

S13、通过仿射变换矩阵得到校正后的医疗报告单图像。

3.如权利要求1所述的不规则医疗报告单图像中敏感信息脱敏方法,其特征在于,步骤S2包括:使用训练好的DBNet模型对已校正的医疗报告单图像进行文本信息检测,得到包括医疗报告单中所有文本信息的文本框位置坐标的列表text_coor_list,列表text_coor_list中包含文本框四个顶点的像素位置。

4.如权利要求1所述的不规则医疗报告单图像中敏感信息脱敏方法,其特征在于,步骤S3包括:

S31、将已校正的医疗报告单图像列表text_coor_list输入训练好的CRNN模型;

S32、遍历列表text_coor_list,基于每个文本框四个顶点的像素位置,将医疗报告单图像中对应的区域裁剪下来输入到训练好的CRNN模型中;

S33、输出识别结果列表text_cont_list,列表text_cont_list中的每个元素的形式为[corrdinate,content,confidence],分别表示每个文本框四个顶点像素位置、文本框中的文本内容和识别置信度。

5.如权利要求4所述的不规则医疗报告单图像中敏感信息脱敏方法,其特征在于,步骤S4包括:

S41、遍历列表text_cont_list,使用THULAC对每个文本框的文本识别内容content进行分词,并标注词性,返回词性标注列表char_list;

S42、遍历词性标注列表char_list,判断当前词cur_word是否在预先设定的敏感信息集合sens_set中,如果在,则标注该词为敏感信息;如果不在,则根据词性进行进一步判断;

S43、根据已被标注为敏感信息的当前词cur_word,检索出该词在当前文本框中的索引位置text_ind和该词的长度text_len,然后根据当前文本框左上角和右下角的坐标位置,将该文本框按照汉字占两个字符,英文字母和单个数字占一个字符进行均等划分,即可确定已被标注为敏感信息的当前词cur_word在医疗报告单中的像素位置word_loc。

6.如权利要求5所述的不规则医疗报告单图像中敏感信息脱敏方法,其特征在于,步骤S42中,根据词性进行进一步判断,包括:

S421、如果当前词cur_word的词性是人名,则标注当前词为敏感信息;

S422、如果当前词cur_word的词性是地名,则标注当前词为敏感信息;

S423、如果当前词cur_word的词性是数词,则根据数词长度进行判断;

S424、如果当前词cur_word的词性是电子邮箱,则标注当前词为敏感信息。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州良医汇网络科技有限公司,未经苏州良医汇网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111567540.4/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top