[发明专利]罕见病知识库的处理方法及装置、可读存储介质有效
申请号: | 202011644230.3 | 申请日: | 2020-12-31 |
公开(公告)号: | CN112687397B | 公开(公告)日: | 2023-05-09 |
发明(设计)人: | 张睿;王觅也 | 申请(专利权)人: | 四川大学华西医院 |
主分类号: | G16H50/70 | 分类号: | G16H50/70;G06F40/247;G06F40/30 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 张萌 |
地址: | 610000 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 罕见 知识库 处理 方法 装置 可读 存储 介质 | ||
1.一种罕见病知识库的处理方法,其特征在于,包括:
获取多个罕见病患者的电子病历;
从所述电子病历中提取出可用数据;所述可用数据包括:多个临床表型术语、所述多个临床表型术语各自对应的罕见病、以及用于表征所述多个临床表型术语和其各自对应的罕见病之间的关联程度的统计信息;
获取罕见病权威知识库;所述罕见病权威知识库中包括多种罕见病和所述多种罕见病对应的多个标准表型术语;
将所述多个临床表型术语与所述多个临床表型术语各自对应的罕见病对应的多个标准表型术语进行比较;
根据比较结果对所述罕见病权威知识库进行优化,得到优化的罕见病权威知识库;所述优化的罕见病权威知识库中的各个标准表型术语对应有所述统计信息。
2.根据权利要求1所述的方法,其特征在于,所述根据比较结果对所述罕见病权威知识库进行优化,得到优化的罕见病权威知识库,包括:
将存在匹配的标准表型术语的临床表型术语对应的统计信息按照与所述匹配的标准表型术语的对应关系存储到所述罕见病权威知识库中。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
获取不存在匹配的标准表型术语的目标临床表型术语;
计算所述目标临床表型术语在其所述对应的罕见病中的出现频率;
若所述出现频率大于或者等于预设频率,且所述目标临床表型术语属于所述多个标准表型术语中的上位概念,不存储所述目标临床表型术语;
若所述出现频率大于或者等于预设频率,且所述目标临床表型术语属于所述多个标准表型术语的下位概念,将所述目标临床表型术语和其对应的统计信息存储到所述罕见病权威知识库中。
4.根据权利要求1至3任一项所述的方法,其特征在于,所述方法还包括:
针对不存在匹配的临床表型术语的标准表型术语,确定是否存在未进行匹配的临床表型术语;
在确定不存在未进行匹配的临床表型术语时,从所述罕见病权威知识库中删除所述不存在匹配的临床表型术语的标准表型术语。
5.根据权利要求1所述的方法,其特征在于,在所述根据比较结果对所述罕见病权威知识库进行优化,得到优化的罕见病权威知识库后,所述方法还包括:
获取目标患者的电子病历;
从所述电子病历中提取出目标临床表型术语;
将所述目标临床表型术语与所述优化的罕见病权威知识库中的标准表型术语进行匹配;
在确定所述目标临床表型术语存在匹配的标准表型术语时,根据所述匹配的标准表型术语对应的统计信息确定所述目标临床表型术语对应的目标罕见病并反馈。
6.根据权利要求1所述的方法,其特征在于,所述获取罕见病权威知识库,包括:
获取已有的遗传病知识库和罕见病知识库;
从所述遗传病知识库和所述罕见病知识库中分别提取出多种已知罕见病和所述多种已知罕见病对应的已知表型术语;
基于所述多种已知罕见病和所述多种已知罕见病对应的已知表型术语构建所述罕见病权威知识库。
7.根据权利要求6所述的方法,其特征在于,所述遗传病知识库包括:OMIM库;所述罕见病知识库包括:Orpha库和eRAM库。
8.根据权利要求1所述的方法,其特征在于,所述从所述电子病历中提取出可用数据,包括:
基于已有的术语库从所述电子病历中提取出所述多个临床表型术语;
根据所述电子病历中的患者诊断结果确定所述多个临床表型术语各自对应的罕见病;
统计各个罕见病下的多个临床表型术语的频数以及TF-IDF信息,得到所述统计信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学华西医院,未经四川大学华西医院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011644230.3/1.html,转载请声明来源钻瓜专利网。