[发明专利]一种基于随机游走的医药领域知识推理方法在审
申请号: | 201910876121.5 | 申请日: | 2019-09-17 |
公开(公告)号: | CN110609907A | 公开(公告)日: | 2019-12-24 |
发明(设计)人: | 张吉昕;秦拯;欧露;颜俊;陈浩;欧博;翟亚静 | 申请(专利权)人: | 湖南大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/35;G06F16/33;G16H70/00;G06F17/27 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 410082 湖南省*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 医药领域 命名实体 推理 图谱 随机游走 抽取 实体间关系 情感分类 自动构建 二元组 信息熵 谓词 | ||
本发明涉及一种基于随机游走的医药领域知识推理方法。其发明内容主要包括(1)基于上下文字符二元组和信息熵的医药领域命名实体识别方法;(2)基于谓词情感分类的医药领域实体间关系抽取方法;(3)基于随机游走的医药领域知识图谱推理方法。基于上述方法,识别医药领域命名实体、抽取命名实体间关系,从而自动构建医药领域知识图谱,并实现医药领域知识图谱推理。
技术领域
本发明涉及知识工程和机器学习领域,一种基于随机游走的医药领域知识推理方法。
背景技术
知识图谱技术作为知识工程和人工智能领域的关键技术之一,是当前热门的技术研究领域之一。不同于机器学习技术,往往存在特征间局部关系难解释以及特征与输出间全局关系难解释的问题,知识图谱技术通过三元组表示知识实体间关系,直观的反映知识本体和知识实体间关联逻辑,具有很好的可解释性,已得到工业界越来越多的重视,成为人工智能技术的重要基础之一。
知识图谱技术主要包括构建、推理等方面,其中,知识图谱构建技术主要包括命名实体识别、关系抽取等,知识图谱推理技术主要包括实体关系预测、知识推理等。通过从文本数据中的事实中识别知识实体、抽取知识实体间的关系,并基于三元组表示法构建知识图谱,并通过挖掘和预测可能存在的实体间关系来对知识图谱进行补全,基于知识图谱中已知的实体间关系进行知识规则的提取与推理。
医药领域作为知识密集型领域,十分依赖医学、药学背景知识,利用知识图谱表示医学、药学背景知识,对医药领域的辅助智能应用有着十分重要的支撑作用。然而,医药领域的命名实体、实体间关系、知识逻辑等具有十分鲜明的领域特点,相较于通用领域有着较大差异,需要提出有针对性的知识图谱构建与推理技术支撑知识图谱在医药领域中的辅助智能应用。
发明内容
本发明目的旨在解决医药知识图谱自动构建和推理问题。
为此,本发明提出了一种基于随机游走的医药领域知识推理方法,主要包括三部分内容:
(1)基于上下文字符二元组和信息熵的医药领域命名实体识别方法;
(2)基于谓词情感分类的医药领域实体间关系抽取方法;
(3)基于随机游走的医药领域知识图谱推理方法。
具体内容如下:
采用方法(1)识别医药领域命名实体,包括药品、疾病、症状、人群、成分等概念;采用方法(2)抽取医药领域命名实体间的正向关系和负向关系,包括适用、禁忌等关系;利用医药领域命名实体和实体间关系自动构建医药知识图谱,并采用方法(3)实现医药知识图谱推理。基于上述方法实现医药知识图谱自动构建以及医药领域知识推理。
(1)基于上下文字符二元组和信息熵的医药领域命名实体识别方法。
收集常规语料和医药专业语料,去掉其中标点符号和停用词,根据医药语料和常规预料库中上下文分别建立了两个字符转移概率矩阵,矩阵中的每个元素是上下文中的转移频率值。令Matmedical为医药语料的上下文字符转移概率矩阵,Matnormal为常规语料的上下文字符转移概率矩阵,令{ci,ci+1}为语料中连续的字符上下文,通过分别计算{ci,ci+1}在医药语料和常规语料中转移概率,我们得到矩阵Matmedical(ci,ci+1)和矩阵Matnormal(ci,ci+1)。
基于医药语料和常规语料的上下文字符转移概率矩阵,采用信息熵计算每组字符上下文属于医药领域的显著程度,由于常规语料中的字符转移概率比较稳定,医药语料中显著偏离常规语料字符转移概率的字符上下文则判定医药命名实体。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南大学,未经湖南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910876121.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:知识图谱构建方法及装置、存储介质及电子终端
- 下一篇:案件串并方法及装置