[发明专利]一种用于医疗票据OCR的医保目录匹配方法有效
申请号: | 202210087319.7 | 申请日: | 2022-01-25 |
公开(公告)号: | CN114445842B | 公开(公告)日: | 2022-09-20 |
发明(设计)人: | 褚一平;陈士春;唐志学;郑义;陈建勇;朱华山;郁星星;张雪妮;潘翔;赵小敏;郑河荣;黄叶珏 | 申请(专利权)人: | 杭州海量信息技术有限公司 |
主分类号: | G06V30/418 | 分类号: | G06V30/418;G06V30/10;G06F16/901;G06F16/903;G06F40/289 |
代理公司: | 北京盛询知识产权代理有限公司 11901 | 代理人: | 方亚兵 |
地址: | 310012 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 医疗 票据 ocr 医保 目录 匹配 方法 | ||
1.一种用于医疗票据OCR的医保目录匹配方法,其特征在于,包括,
基于医保目录库中的医保目录构建医保目录库热力图;
设置医保目录相似度度量方法,所述医保目录相似度度量方法包括双目录相似度度量方法与费用-目录相似度度量方法;
基于所述医保目录库热力图与所述双目录相似度度量方法构建医保目录池塘结构库;
基于所述费用-目录相似度度量方法与所述医保目录池塘结构库对医疗票据OCR的费用明细进行搜索,完成所述医保目录匹配;
构建所述医保目录库热力图的方法为:
获取所述医保目录的关键字字频表;
基于所述关键字字频表对医保目录的每个条目中的字符进行关键字匹配,获取所述医保目录的热力数据;
基于所述热力数据中的元素建立所述医保目录库热力图;
获取所述关键字字频表的方法为:
对所述医保目录进行去非中文字符处理,获得纯中文字符的医保目录,对所述纯中文字符的医保目录的条目进行中文分词,获得分词集合,对所述分词集合去重,采用人工的方式纠正错误分词,并对所述纠正后的分词再次去重,得到医保目录关键字集合,统计所述医保目录中每个中文字符的出现频率,获得字符频率表,基于所述字符频率表获取所述医保目录关键字集合中的每条关键字中每个字符的频率,计算所述关键字的全部字符频率均值,将所述频率均值作为所述关键字的字频,在所述关键字集合中加入对应的所述字频,获得关键字字频表;
获取所述医保目录的热力数据的方法为:
建立空链表,基于所述关键字字频表对所述医保目录的每个条目中的字符进行关键字匹配,基于匹配结果,将所述关键字的起止位置插入所述空链表中,插入所述关键字的起止位置后的所述空链表即所述医保目录的热力数据;
构建所述医保目录池塘结构库的方法为:
建立与所述医保目录相同长度的标志位数据,基于所述双目录相似度度量方法,获取所述标志位数据的双目录相似度,基于所述标志位数据的值与所述标志位数据的双目录相似度获取相似度阈值参数;
基于所述双目录相似度度量方法,从所述医保目录库中的最后一个医保目录开始,逐条计算最后一个医保目录与其它医保目录两两之间的的双目录相似度,其中,将所述双目录相似度大于所述相似度阈值参数的医保目录,以及对应的所述医保目录库热力图放入一个临时库,将所述临时库当做一个池塘,根据同样的方法对所述医保目录库中的其它医保目录进行处理,获得若干池塘,将每个池塘中的最后一个医保目录作为该池塘的索引目录,把各个池塘的索引目录组在一起,建立所述医保目录池塘结构库。
2.根据权利要求1所述的用于医疗票据OCR的医保目录匹配方法,其特征在于,所述医保目录匹配的方法为:
预设相似度阈值,基于所述费用-目录相似度度量方法与所述医保目录池塘结构库对医疗票据OCR的费用明细进行搜索,获取所述医疗票据OCR的费用明细的费用-目录相似度,基于所述预设相似度阈值与所述费用-目录相似度完成所述医保目录池塘结构库的搜索,对搜索结果进行汇总,完成医保目录匹配。
3.根据权利要求1所述的用于医疗票据OCR的医保目录匹配方法,其特征在于,所述双目录相似度度量方法的表达式为:
其中,q为Hs与Hd的匹配数,Hs与Hd分别为两条医保目录对应的关键字位置链表,ω(·)表示医保目录对应的关键字链表长度。
4.根据权利要求2所述的用于医疗票据OCR的医保目录匹配方法,其特征在于,所述费用-目录相似度度量方法为:
基于所述医疗票据OCR的费用明细与所述医保目录库中的医保目录进行字符相似度匹配,完成所述费用-目录相似度度量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州海量信息技术有限公司,未经杭州海量信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210087319.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于机械制造的多功能夹具
- 下一篇:一种电磁阀导向铁芯加工车床