[发明专利]医疗领域知识图谱构建方法、装置、设备及存储介质在审
| 申请号: | 202010592333.3 | 申请日: | 2020-06-24 |
| 公开(公告)号: | CN111831908A | 公开(公告)日: | 2020-10-27 |
| 发明(设计)人: | 张圣 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
| 主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/36;G06F40/279;G06F16/332 |
| 代理公司: | 深圳市明日今典知识产权代理事务所(普通合伙) 44343 | 代理人: | 王杰辉 |
| 地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 医疗 领域 知识 图谱 构建 方法 装置 设备 存储 介质 | ||
本申请涉及到智慧城市中智慧医疗领域,公开了一种医疗领域知识图谱构建方法,包括:对医学领域相关的垂直性网站进行知识抽取,存入知识库;以及,对百科类网站进行知识抽取,对抽取到的知识数据进行实体文本识别,将识别到的所述实体文本输入到预先训练的实体领域识别模型中,将识别结果为医疗领域实体的实体文本所对应的知识数据存入所述知识库;对所述知识库中的数据进行知识加工;对知识加工后的数据进行质量评估;将通过质量评估的数据构建成知识图谱。所述领域识别模型和构建完成知识图谱可以存储及应用于区块链中。本申请的医疗领域知识图谱构建方法,可以构建健全的医疗领域知识图谱,具有良好的迁移性,可用于其他领域知识图谱构建。
技术领域
本申请涉及到智慧城市中智慧医疗领域,特别是涉及到一种医疗领域知识图谱构建方法、装置、设备及存储介质。
背景技术
近年来,基于知识图谱的问答系统则成为各行业研究和应用的热点方向。知识图谱将知识用三元组(实体、关系/属性、属性值)的方式表达,做到人类易懂组织形式,使用图作为表示知识的数据结构,因此称为知识图谱。用图的节点来表示客观世界的概念和实体或是他们的属性值,用节点之间的边表示概念和实际的关系或属性,节点-边-节点组成了表示知识和事实的陈述语句。而且应用知识图谱在语义层面表示客观世界的知识和事实,能够建立各种智能应用,具有集成和积累的特性。基于知识图谱构建问答系统在数据上具有以下优势:(1)利用数据关联度解决语义理解智能化程度问题;(2)利用数据精度解决回答准确率问题;(3)利用三元组的数据结构化提高问题检索效率。
高质量的医学知识图谱是智慧医疗、精准智能医疗的重要基础。发明人意识到,目前市场上高质量的医学领域知识图谱较少,因为目前专业性较强的知识图谱构建过程的数据源选择具有局限性,一般仅在领域相关的垂直性网站上进行抽取,而忽略了百科类网站中的相关知识数据,百科类网站中具有各个领域的大量的知识数据,知识抽取工作相对复杂和繁琐。
发明内容
本申请的主要目的为提供一种医疗领域知识图谱构建方法、装置、设备及存储介质,旨在解决如何构建健全的医疗领域知识图谱的技术问题。
为了实现上述发明目的,本申请提出一种医疗领域知识图谱构建方法,包括:
对医学领域相关的垂直性网站进行知识抽取,存入知识库;以及,
对百科类网站进行知识抽取,对抽取到的知识数据进行实体文本识别,将识别到的所述实体文本输入到预先训练的实体领域识别模型中,将识别结果为医疗领域实体的实体文本所对应的知识数据存入所述知识库;
对所述知识库中的数据进行知识加工;
对知识加工后的数据进行质量评估;
将通过质量评估的数据构建成医疗领域知识图谱;
将所述医疗领域知识图谱应用于医学相关知识智能问答。
进一步地,所述将识别到的所述实体文本输入到预先训练的实体领域识别模型中的步骤包括:
将实体文本分词处理,输入到Token Embedding层,得到词向量e1,e2…,en;
将词向量e1,e2…,en输入LSTM层,得到隐藏向量h1,h2…,hn;
将隐藏向量进行Attention计算得到表征向量v,Attention计算过程如下:
v=∑iαihi,i=1,…,n;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010592333.3/2.html,转载请声明来源钻瓜专利网。





