[发明专利]一种基于文本检索的可解释性智慧医疗辅助诊断系统有效
申请号: | 202110021525.3 | 申请日: | 2021-01-08 |
公开(公告)号: | CN112687388B | 公开(公告)日: | 2023-09-01 |
发明(设计)人: | 董守斌;刘晓峰;胡金龙;袁华 | 申请(专利权)人: | 中山依数科技有限公司 |
主分类号: | G16H50/20 | 分类号: | G16H50/20;G16H50/70;G06F16/33;G06F16/36 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 冯炳辉 |
地址: | 528400 广东省中山市火炬*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 文本 检索 解释性 智慧 医疗 辅助 诊断 系统 | ||
本发明公开了一种基于文本检索的可解释性智慧医疗辅助诊断系统,包括:查询预处理模块,用于对病人病历进行预处理,得到与患病信息相关的查询词;知识图谱构建模块,用于与查询词结合形成一个新的关于特定疾病的知识图谱;文本检索模块,用于通过查询词以及新的知识图谱来检索医学数据库中与查询词相关的以往的病例及治疗方案;可解释的辅助诊断模块,用于解释检索出与病人病历相关的病例及治疗方案的原因。本发明可有效解决长文档长距离依赖的语义编码问题,以及将知识图谱很好地融入到查询词中,并通过知识图谱上和预训练的自注意力模型的权重值得到与查询词相关的实体信息或者文档片段,从而为智慧诊断提供更为精准的可解释性结果。
技术领域
本发明涉及文本检索的技术领域,尤其是指一种基于文本检索的可解释性智慧医疗辅助诊断系统。
背景技术
随着计算机领域的飞速发展,各行业与计算机结合越来越深。借助计算机可以利用行业内的数据进行数据挖掘,数据分析。尤其是在医学领域,近年来计算机领域里的深度学习方法可以从海量数据中提取原始特征,然后发现这些原始特征背后的规律,从而解决复杂问题。随着技术的发展和计算能力的增强,深度学习在医疗领域的应用越来越广泛,智慧医疗已经在病例分析、疾病预测中获得初步成果,但深度学习模型属于黑盒子性质,即可解释性较差,不能给出哪些数据对于医疗诊断起了决定作用,因此医生对于医疗诊断结果不能完全相信,这样妨碍计算机技术用于生物医学领域。智慧医疗辅助诊断的可解释性模型就是提供疾病诊断结果的可解释性,即诊断疾病时,不仅仅是单纯给出诊断结果,还需要给出相关解释,例如诊断结果的由来,相关的案例等。
本专利运用文本检索技术,通过病例诊断结果或生物医学文献检索出相关的病例信息,从中找到以往的相似病例提供给医生。然而传统的检索方法,是对精准词的匹配,即使从生物医学知识库中加入词义相同的或者相关的词也不能很好解决,精准匹配带来的语义鸿沟问题。而最近深度学习技术应用于文本检索上,可以取得不错的效果,如将查询词或者拓展词与文档中的词通过神经网络映射到低维向量空间,从而更好比较两者的语义,找出具有相似语义但不完全匹配的词。除此之外,神经网络还可以通过深层的网络挖掘查询语句与文档整体语义匹配。然而大多数基于神经网络的检索模型并不能很好地解释检索结果,即只提供与查询相关的文章,而并不知道文档中哪些词或者哪些片段与查询语句有关,这还是会导致医生很难理解为什么得到这样的检索结果。此外,如果文档篇章过长,现有的神经网络不能很好地捕获文档中的语义信息,意味着不能很好地匹配文档与查询之间的语义关系。
文本检索可以提供病例诊断可解释性的结果,但可解释性的程度还不够,需要引入外部知识库以进一步解释检索结果。除此之外,最近比较流行的自注意模型也可以促进结果的可解释性。这种结构也可以用于解决文档过长所带来的长距离依赖的语义问题。
发明内容
本发明的目的在于克服现有技术的缺点与不足,提出了一种基于文本检索的可解释性智慧医疗辅助诊断系统,可有效解决长文档长距离依赖的语义编码问题,以及将知识图谱很好地融入到查询词中,并通过知识图谱上和预训练的自注意力模型的权重值得到与查询词相关的实体信息或者文档片段,从而为智慧诊断提供更为精准的可解释性结果。
为实现上述目的,本发明所提供的技术方案为:一种基于文本检索的可解释性智慧医疗辅助诊断系统,包括:
查询预处理模块,用于对病人病历进行预处理,得到与患病信息相关的查询词;
知识图谱构建模块,用于与查询词结合形成一个新的关于特定疾病的知识图谱;
文本检索模块,用于通过查询词以及新的知识图谱来检索医学数据库中与查询词相关的以往的病例及治疗方案;
可解释的辅助诊断模块,用于解释检索出与病人病历相关的病例及治疗方案的原因。
进一步,所述查询预处理模块对病人病历进行的预处理包括分词、去标点符号、去停用词和拼写纠正,然后通过语法解析保留名词短语和动词短语,将其作为后续知识图谱融合的实体。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山依数科技有限公司,未经中山依数科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110021525.3/2.html,转载请声明来源钻瓜专利网。