[发明专利]一种医疗领域知识图谱构建的方法在审
| 申请号: | 202310287769.5 | 申请日: | 2023-03-22 |
| 公开(公告)号: | CN116541472A | 公开(公告)日: | 2023-08-04 |
| 发明(设计)人: | 张怡;章永 | 申请(专利权)人: | 麦博(上海)健康科技有限公司 |
| 主分类号: | G06F16/28 | 分类号: | G06F16/28;G06F16/901;G06F16/23;G06F40/295;G06N3/0442;G06N3/0464;G06N5/022;G06N5/04;G16H50/70;G16H50/20;G16H20/10 |
| 代理公司: | 北京卓岚智财知识产权代理有限公司 11624 | 代理人: | 蒋真 |
| 地址: | 200000 上海市浦东新区中国*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 医疗 领域 知识 图谱 构建 方法 | ||
1.一种医疗领域知识图谱构建的方法,其特征在于,包括S1、获取医疗领域相关数据,主要包括结构化数据、半结构化数据和非结构化数据;S2、对获取到的数据进行知识抽取和存储;S3、对已有的知识进行融合,包括本体融合和实体融合;S4、对知识图谱进行知识加工,包括本体构建、知识推理、知识更新和质量评估。
2.根据权利要求1所述的一种医疗领域知识图谱构建的方法,其特征在于,所述步骤S1具体包括以下内容:
通过接入已有的医疗相关系统数据、网络爬虫爬取医疗数据等方式获取医疗相关的结构化数据、半结构化数据和非结构化数据,并对获取到的数据进行分类和清洗;
其中,接入已有的医疗相关系统数据的步骤如下:
S1.1.1、对已有的医疗系统进行调研;
S1.1.2、接入已有的医疗系统数据;
网络爬虫爬取医疗数据的步骤如下:
S1.2.1、获取目标医疗数据的URL;
S1.2.2、向对应URL提交HTTP请求;
S1.2.3、解析HTTP响应;
S1.2.4、存储解析结果。
3.根据权利要求1所述的一种医疗领域知识图谱构建的方法,其特征在于,所述步骤S2具体包括结构化数据的知识提取和对半结构化和非结构化数据进行知识提取,其中结构化数据的知识提取通过利用R2RML映射语言将知识从关系数据库映射到RDF数据集中;而对半结构化和非结构化数据进行知识提取采用LSTM-CRF命名实体识别模型进行实体抽取或采用PCNN分段卷积神经网络进行关系抽取;最后将抽取的知识存入到Jena(Apache旗下的RDF三元组数据库)中。
4.根据权利要求3所述的一种医疗领域知识图谱构建的方法,其特征在于,所述步骤S2中采用LSTM-CRF命名实体识别模型进行实体抽取时,模型的构建流程如下:
S2.1.1、建立Embedding层,将词映射为词向量;
S2.1.2、建立n层的双向LSTM层,学习词的前后语义信息;
S2.1.3、建立CRF层,对各个词进行序列标注;
采用PCNN分段卷积神经网络进行关系抽取,模型的构建流程如下:
S2.2.1、建立Embedding词向量提取层,将词和词的位置信息映射为词向量;
S2.2.2、建立卷积层,对文本进行分段卷积操作;
S2.2.3、建立max池化层;
S2.2.4、建立输出层,激活函数为softmax函数;
采用DMCNN动态多池化卷积神经网络进行事件抽取时,模型的构建流程如下:
S2.3.1、建立Embedding词向量提取层,将词和词的位置信息映射为词向量;
S2.3.2、建立句子级特征提取层,具体包括:
S2.3.2.1、建立卷积层,对文本进行分段卷积操作;
S2.3.2.2、建立max池化层;
S2.3.3、建立词汇级特征提取层;
S2.3.4、将句子级特征提取层和词汇级特征提取层得到的向量合并;
S2.3.5、建立输出层,激活函数为softmax函数。
5.根据权利要求1所述的一种医疗领域知识图谱构建的方法,其特征在于,所述步骤S3中本体融合具体包括以下内容:
S3.1.1、导入待映射的本体,待映射的本体不一定都要转换为统一的本体语言格式,但是要保证本体中需要进行映射的成分能够被方便获取;
S3.1.2、发现映射,基于术语的本体融合算法,寻找异构本体间的联系,然后根据这些联系建立异构本体间的映射规则;
S3.1.3、表示映射,当本体之间的映射被找到后,需要将这些映射合理地表示起来。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于麦博(上海)健康科技有限公司,未经麦博(上海)健康科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310287769.5/1.html,转载请声明来源钻瓜专利网。





