[发明专利]一种高血压药物治疗知识图谱构建方法以及装置在审
申请号: | 202111517662.2 | 申请日: | 2021-12-13 |
公开(公告)号: | CN114255884A | 公开(公告)日: | 2022-03-29 |
发明(设计)人: | 匡泽民;鄂海红;宋美娜;谢晓璇;王晴川;谭玲 | 申请(专利权)人: | 首都医科大学附属北京安贞医院;北京邮电大学 |
主分类号: | G16H70/40 | 分类号: | G16H70/40;G16H50/70;G06F16/36 |
代理公司: | 北京成实知识产权代理有限公司 11724 | 代理人: | 陈永虔 |
地址: | 100029*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 高血压 药物 治疗 知识 图谱 构建 方法 以及 装置 | ||
1.一种高血压药物治疗知识图谱构建方法,其特征在于:
高血压药物治疗知识图谱采用自上而下的方式,先构建Schema,再抽取知识;构建过程根据抽取和应用实际情况,不断完善和优化Schema;
构建属性图模型;
对属性图模型采用HugeGraph和MongoDB混合数据存储模式;
采用数据加工和专家审核相结合增加知识准确度。
2.根据权利要求1所述的一种高血压药物治疗知识图谱构建方法,其特征在于,所述的构建Schema的步骤为:
a确定领域范畴;
b选取合适的知识源;
c梳理重要的医学术语;
d建立关系;
e存储及可视化。
3.根据权利要求2所述的一种高血压药物治疗知识图谱构建方法,其特征在于,所述的梳理重要的医学术语,包含建立高血压领域的标准术语词库,所述标准术语词库内设有中英文一一对应术语映射表,每一个词条还设有详细的中英文解释,以实现在高血压领域内部使用规范术语,从而对帮助知识图谱构建过程中术语使用准确。
4.根据权利要求1所述的一种高血压药物治疗知识图谱构建方法,其特征在于,所述构建属性图模型中,采用顶点表示现实世界中的实体,有向的边来表示实体与实体之间的关系;顶点和边都可通过键值对形式被关联上任意数量的属性,所述高血压药物治疗知识图谱以六元组形式,分别采用Subject,Subject_Property,Edge,Edge_Property,Object,Object_Property来表示复杂的医学知识,其中Subject表示起始顶点,Subject_Property表示起始顶点的属性,Edge表示有向边,Edge_Property表示有向边的属性,Object表示目标顶点,Object_Property表示目标顶点的属性;针对高血压药物治疗决策支持这一使用临床需求,从而构建了以属性图为数据模型的高血压药物治疗知识图谱本体。
5.根据权利要求1所述的一种高血压药物治疗知识图谱构建方法,其特征在于,所述Hugegraph负责存储高血压药物治疗相关基础医学知识,所述MongoDB负责存储临床证据的知识,主要包括高血压药物治疗相关RCT研究文章、最新的高血压诊疗临床指南,所述数据加工通过文本信息自动抽取和医师人工录入,所述文本信息自动抽取的部分数据来源于爬虫,为确保获取数据的准确性和完整性,所述爬虫在采集数据时,采用三级链接数据爬取的方式,运用机器学习算法模型对文本实体标注,文本关系标注;为确保标注数据的正确性,在数据加工和更新至知识图谱之间,还设有专家审核数据审核的步骤。
6.根据权利要求5所述的一种高血压药物治疗知识图谱构建方法,其特征在于,所述数据加工步骤中的机器学习算法采用CART分类回归树对文本数据进行预标注,降低用户标注的工作量;对每一个用户新建的标注都应添加该类实体或该类关系标注所需要拥有的全部性质,从而保证知识图谱数据库新增内容的完整性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于首都医科大学附属北京安贞医院;北京邮电大学,未经首都医科大学附属北京安贞医院;北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111517662.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种电网设备启动方案智能成票系统
- 下一篇:一种带外主动隔离故障外设的方法