[发明专利]基于深度对抗学习的多语言医疗术语规范标准化系统及方法有效
申请号: | 202110588841.9 | 申请日: | 2021-05-27 |
公开(公告)号: | CN113377897B | 公开(公告)日: | 2022-04-22 |
发明(设计)人: | 任元凯;江振荣 | 申请(专利权)人: | 杭州莱迈医疗信息科技有限公司 |
主分类号: | G06F16/31 | 分类号: | G06F16/31;G06F16/36;G06F40/247;G06F40/289;G06F40/30;G06K9/62;G06N3/04;G16H10/60 |
代理公司: | 南京乐羽知行专利代理事务所(普通合伙) 32326 | 代理人: | 李培 |
地址: | 310051 浙江省杭州市滨江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 对抗 学习 语言 医疗 术语 规范 标准化 系统 方法 | ||
本发明公开基于深度对抗学习的多语言医疗术语规范标准化系统,包括标准医学术语库、文件预处理模块、候选术语集生成模块及候选术语集重排模块;所述文件预处理模块,用于统一真实世界的医学术语字符串的格式,以及将长字符串开分成单个的中文及英文词token;所述候选术语集生成模块,用于从标准医学术语集合中筛选出前n个与真实世界医学术语最相似的候选标准术语;所述候选术语集重排模块:用于将真实世界医学术语与筛选出来的候选术语组成术语对,根据匹配程度标注成正例和负例,作为深度学习模型的输入,模型通过迭代优化生成自动术语匹配模型。
技术领域
本发明涉及基于深度对抗学习的多语言医疗术语规范标准化系统及方法,属于医疗技术领域。
背景技术
国内医学领域,尤其是电子病历的书写中,术语种类繁多,不规范化情况严重,以往的方案是对电子病历进行信息提取以后,根据中文字符串匹配出相似的标准术语,再由医学领域的专家对这些术语进行全人工的或者半自动的校对。医疗术语规范化的工作费时费力,效率不高。
经检索,公开号CN109446340A,一种医学标准术语本体管理系统及方法、设备和存储介质,该专利公开了构建医学标准术语本体管理系统所需的术语概念体系、结构化定义和分类,侧重于术语标准的数量保证和质量评价。
公开号CN110349639A,一种基于通用医疗术语库的多中心医疗术语标准化系统,该专利公开了在多个医疗数据中心之间管理医疗术语标准化的流程,以解决多家医疗机构术语表达不一致的问题。
公开号CN112101014A,一种混合特征融合的中文化工文献分词方法,公开了构造word2vec语言模型,通过CNN和BiLSTM模型抽取文本特征,利用融合后的特征提高中文化工文献分词效果的方法,主要解决化工文献中、英文术语的识别和分割问题。
目前,中文医疗术语标准化的工作仍存在以下问题:
1.由于中文医疗信息化建设的历史较短,包含中文医疗标准术语、同义词及其他重要语义关系,如疾病与药品关系,等信息的知识库和知识图谱资源有限。
2.以同义词作为主要匹配方式的术语标准化方法不足以涵盖真实世界数据中大量出现的、多样化的术语不规范表达。
3.目前工作主要集中在中文医疗术语表达之间的映射,缺乏灵活的自动模型,可以灵活支持中文到中文、中文到英文、中文到其他语言的术语映射,为医学研究、应用和我国医学信息化技术与产品的国际化输出造成障碍。
针对此类情况,本发明提供了一种基于多语种医疗知识图谱特征和对抗学习的自动化术语规范化系统及方法。以英文为主的国际医疗术语标准库相对较为丰富(如SNOMED-CT,UMLS,ICD等),可以在构建自动术语标准化模型时作为中文资源的重要补充,对抗学习模型抽取的多语种公共特征,有助于减少人工标注的数据量,增加模型的通用型,并且保持术语规范化的准确率在可接受范围内,再结合人工进行少量的校对,以此达到高精度的目的。
发明内容
发明目的:针对现有技术中存在的问题与不足,本发明提供一种基于深度对抗学习搜索召回率及查全率高的多语言医疗术语规范标准化系统及方法。
技术方案:基于深度对抗学习的多语言医疗术语规范标准化系统,包括标准医学术语库,其特征在于:还包括文件预处理模块、候选术语集生成模块、候选术语集重排模块以及输出模块;
所述文件预处理模块,用于统一真实世界的医学术语字符串的格式,以及将长字符串开分成单个的中文及英文词token;
所述候选术语集生成模块,用于从标准医学术语集合中筛选出前n个与真实世界医学术语最相似的候选标准术语;
所述候选术语集重排模块:用于将真实世界医学术语与筛选出来的候选术语组成术语对,根据匹配程度标注成正例和负例,作为深度学习模型的输入,模型通过迭代优化生成自动术语匹配模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州莱迈医疗信息科技有限公司,未经杭州莱迈医疗信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110588841.9/2.html,转载请声明来源钻瓜专利网。