[发明专利]一种基于集成卷积编码的医疗问答语义聚类方法有效

专利信息
申请号: 201710723583.4 申请日: 2017-08-22
公开(公告)号: CN107516110B 公开(公告)日: 2020-02-18
发明(设计)人: 余志文;戴丹 申请(专利权)人: 华南理工大学
主分类号: G06K9/62 分类号: G06K9/62;G06N3/04;G06N3/08
代理公司: 广州市华学知识产权代理有限公司 44245 代理人: 李斌
地址: 510640 广*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 集成 卷积 编码 医疗 问答 语义 方法
【说明书】:

发明公开了一种基于集成卷积编码的医疗问答语义聚类方法,涉及机器学习领域,所述方法包括以下步骤:医疗咨询平台用户问答语料采集,卷积核的选取,融合不同卷积核的特征表示,利用自编码机获取最终数据表征,进行医疗咨询问答语义聚类。与传统的深度学习方法相比:本方法用不同的卷积核来提取不同的特征,提取的特征更加充分和多样化,并且使用不同的特征合并方法,将提取到的特征进行融合表示,因此本发明泛化能力强,语义聚类准确率高,基于该方法能够更好地帮助用户了解自身情况,并可辅助医生进行疾病检测,对搭建医疗的自动问答系统具有很大的应用价值。

技术领域

本发明涉及计算机人工智能领域,尤其是机器学习领域,具体涉及一种基于集成卷积编码的医疗问答语义聚类方法。

背景技术

随着互联网的飞速发展,人们的生活方式逐渐进行了改变。经统计调查,当普通用户身体发生不适的时候,有90%的人会到互联网上搜索相关的信息。互联网因此也正在改变医疗生态。在互联网医疗中,在线疾病导诊是很重要和关键的一步。从而使得在健康相关的医疗领域,出现了许多在线疾病问答网站。病人通过描述自己的遭遇、详细病情、用药和治疗情况等来和医生进行交流并获取疾病相关的护理知识。在这些相关疾病问答中,包含了许多个例的疾病信息。若从这些医疗问答语料中获取病人对相关疾病的表征,有助于发掘和了解大量的有用信息,可提供追溯性,可对病人进行疾病预测,且在医疗自动问答系统中更容易理解病人咨询的问题,对构建智能医疗有着重要的意义。

医疗语料文本数据具有噪音、稀疏、高维、异构、不完备、系统性偏见等特性,且同样的症状不同患者有不同的描述方式,传统方法是通过专家来选取合适的特征模式,并用特殊的方式来进行表示,但这种方法对特征空间尺度的不充分监督定义,不宜泛化,也错失了发现新的模式和特征的良机,这使得传统方法很难进行表征和建模。无监督表征学习,通过自动识别数据中的模式和依存关系,试着克服监督式特征空间定义的局限性,学会一种简洁又通用的表征,且知识的自动获取使得在建立分类器或其他预测器时能更简单提取有用信息。而近些年,深度学习在图像识别、机器翻译、智能问答等方面的应用越来越多,其本质是通过构建多个隐层的机器学习模型和海量的训练数据来学习更精准的特征,更能够刻画数据的内在信息,对于分析非结构化、模式不明多变、跨领域的大数据具有显著优势,对这些信息知识有很好的表示。但在医疗领域,深度学习的相关技术应用的并不是很广泛,也没有很可靠的应用于医疗智能问答等方面的工作流程中。

目前,国内外的各国政府、各大医疗机构和研究机构在智慧医疗方面都投入了极大的人力、物力和财力进行研究。在国外,较早开展区域协同医疗相关研究的有美国、加拿大、英国和澳大利亚等国家。其中,具有代表的工作是Google对患者的电子病历进行基于降噪自编码机的表示学习来构建特征空间,从而对患者进行疾病预测并给出相关的健康指导。而国内有丁小洪[健康资源共享机制及问答推荐方法研究.西安电子科技大学,2011]在研究医药卫生元数据标准的基础上,给出实现资源共享的步骤,包括资源标准化和数据集成。探讨了一个以元数据为核心、“物理上分布,逻辑上统一”、基于SOA体系结构的医疗资源共享平台,提出了层次式资源共享模型,并从五个不同视图出发来分析这个共享平台。刘芳等[面向医疗行业的智能问答系统研究与实现.微电子学与计算机,2012,11:95-98]为了实现医疗信息化中的疾病与诊疗的智能问答系统,提出一种基于人机交互的用户自然语言问题的理解方法。李超[智能疾病导诊及医疗问答方法研究与应用.大连理工大学,2016]利用大数据技术,在疾病导诊和疾病知识自动问答中进行研究,利用卷积神经网络模型,以及自然语言处理技术构造在线导诊模型,在问诊数据上进行转换和特征构造,提供类人的、权威的、内容丰富的医疗知识。宫继兵等[基于概率因子图模型的医疗社会网络用户健康状态检测方法.计算机研究与发展,2013,50(6):1285-1296]提出一种新的基于时空概率因子图模型(temporal-spatial factor graph model,TS-FGM)的网络用户健康状态检测和预测方法,系统阐述新形势下在一个动态社会网络中节点用户健康状态如何进行检测和预测以及不同因素对用户健康状态影响到何种程度。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710723583.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top