[发明专利]一种针对脑卒中的知识图谱构建方法在审
申请号: | 202011464083.1 | 申请日: | 2020-12-14 |
公开(公告)号: | CN112541086A | 公开(公告)日: | 2021-03-23 |
发明(设计)人: | 潘雨青;徐小波;李峰 | 申请(专利权)人: | 江苏大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G16H50/70;G16H70/20 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 212013 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 针对 脑卒中 知识 图谱 构建 方法 | ||
本发明属于医疗知识图谱的技术领域,尤其涉及脑卒中这一特定领域的知识图谱的构建方法,包括获取,医疗数据;抽取医学实体、医学实体属性以及医学实体关系;设计本体模型,完成知识图谱本体构建;基于所抽取的医学实体、实体属性及实体关系信息结合本体模型进行实体映射,构建脑卒中知识图谱等步骤。本发明通过构建脑卒中领域的知识图谱,对脑卒中的医学知识进行整合,解决了信息不完整的问题,在脑卒中疾病诊断中提供有效的帮助,弥补部分医生医学知识不足的问题,提高标准化诊疗水平。
技术领域
本发明属于医疗知识图谱的技术领域,尤其涉及脑卒中这一特定领域的知识图谱的构建方法。
背景技术
随着医学信息化发展以及临床数据的大规模增长,知识图谱在医学领域起到的作用越来越大。医学领域有着高度专业化的,同时具有丰富多样的医学资源,并且有着不同方向的领域,如脑卒中领域、糖尿病领域等。由于数据获取十分困难,而且不同专业领域知识的缺乏,构建一个涵盖所有疾病的医疗知识图谱是十分困难的。
常规的知识图谱的构建一般包含以下内容:数据获取、知识抽取、知识融合、知识加工以及知识存储。但是针对脑卒中知识图谱的构建,各种疾病直接存在着复杂的概念和关系,仅仅通过简单的医学词库的表示很难对其进行辨识。
综上所述,现有的知识图谱的构建方法不能直接应用于脑卒中领域的知识图谱的构建。因此,亟需提供一个针对脑卒中的知识图谱的构建方法。
发明内容
为克服上述现有的知识图谱构建方法不能直接应用于脑卒中的知识图谱的构建的问题,本发明提供了一种针对脑卒中的知识图谱的构建方法,方法包括以下步骤:
S1:获取脑卒中相关的医疗数据;
S2:对医疗数据进行医学实体、医学实体属性以及医学实体关系的抽取;
S3:进行本体模型设计,完成知识图谱本体构建;
S4:基于所抽取的医学实体、实体属性及实体关系信息结合本体模型进行实体映射,构建脑卒中知识图谱。
进一步地,上述步骤2包括以下步骤:
S2.1:对医疗数据集与医学主题词表进行匹配和标注得到训练数据集,构建实体抽取模型;
S2.2:采用BiLSTM-CRF模型对实体抽取模型进行训练;
S2.3:将字向量和词向量同时作为输入,进行医学实体、医学实体属性以及医学实体关系的抽取。
进一步地,上述步骤2.3中医学实体的抽取步骤包括:
(1)提取医学文本的字向量;
(2)将提取到的每个字向量与医学主题词表(MeSH)进行匹配,筛选与脑卒中相关的词语,得到该字向量对应的字符候选词;
(3)将字符候选词与医学文本进行匹配,得到字向量-词向量对,后续将字向量-词向量对作为实体抽取模型的输入;
(4)将字向量-词向量输入预先构建的BiLSTM-CRF实体抽取模型中的BiLSTM模型,得到模型输出的上下文信息,将上下文信息输入CRF模型中,得到基于上下文信息抽取的医学实体信息。
进一步地,上述步骤2.3中医学实体属性的抽取:根据数据集的结构特点,采用词表匹配的方式抽取医学实体属性以及属性值。
进一步地,上述步骤2.3中医学实体关系的抽取步骤包括:
(1)基于依存句法分析,对CNKI文本数据、电子病历等医疗数据进行预处理,形成数据集合;
(2)以句子为单元将医学文本分割成多个句子,更新数据集合;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏大学,未经江苏大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011464083.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种双向惯性速度型阻尼器
- 下一篇:一种基于视觉引导用焊接机构