[发明专利]基于协同过滤和建议的个性化医学决定支持系统在审
申请号: | 201611140089.7 | 申请日: | 2016-12-12 |
公开(公告)号: | CN107169259A | 公开(公告)日: | 2017-09-15 |
发明(设计)人: | 郭栋梁;连杰;牟晓佳 | 申请(专利权)人: | 为朔生物医学有限公司 |
主分类号: | G06F19/00 | 分类号: | G06F19/00 |
代理公司: | 北京中企鸿阳知识产权代理事务所(普通合伙)11487 | 代理人: | 郭鸿雁 |
地址: | 新加坡第*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 协同 过滤 建议 个性化 医学 决定 支持系统 | ||
技术领域
本发明涉及数据检索技术领域,特别涉及一种基于协同过滤和建议的个性化医学决定支持系统。
背景技术
现今,医疗专业人员已经广泛认识到临床实践中使用信息技术的优势所在。但是,因为读者的知识工具有限和背景知识不足,可能很难从诊断报告获取更多的数据。
为了能够充分挖掘现有医疗保健信息,给医生提供改善的个性化支持工具,需要在医学决定支持系统中集成一些信息检索技术,例如建议系统。
如今建议服务已被广泛用于提供建议信息,例如通过电子商务网站采购的产品、租赁和订购等。为了运行此类服务,要提供项目或特征清单作为输入,可以生成与输入集总体类似或相关的顺序表。
随着电子病例(EMR)逐渐被采用,通过文本和数据挖掘发现健康、疾病和诊断已经成为趋势。从EMR中检索到的重要启示信息可进一步引导医生制定有效的治疗策略。由于医学术语的复杂性和模糊性,从EMR中搜索和查询相关信息通常很有挑战性。另一方面,各种类型的病例中存在大量相关信息,也会因用药证据不足而导致医学决定的不确定性和可变性。但是,通过挖掘EMR之间的关系,人们可以发现常见共现记录之间的联系。具体来讲,想象对患者主诉进行大范围差异诊断时,医生可以参考其他类似患者,从而可以权衡许多干预的相对风险和收益。尽管医生的要求(例如化验室、成像和用药)很具体,但以前的类似EMR可为临床决定提供更有力的支持。
在发病最早期识别疾病并非因为可能会有多种病因就毫无意义。化验室检验通常仅在医生听取患者主诉后才开方进行。因此,患者已出现疾病后才会进行医学干预,而且通常受到医生经验和知识的严重限制。
Davis(DavisDAC.N.,2008)等先锋人士早已使用患者临床史结合协同过滤方法进行疾病预测。Davis及其同事在其工作中创建了建议引擎,用诊断疾病表征每位患者。Steinhaeuser(SteinhaeuserK,2009)和Chawla对协作过滤和分类方法进行了组合, 用于选择类似患者进行预测。Folino(FolinoFP.C.,2010IEEE23rd)等人引入使用关联分析的集群和用于疾病预测的模型;他们首先将类似患者组成一组,然后通过对比患者资料预测可能患有的疾病。Duan等人将建议系统用于协助护理计划。他们的模型可以基于用户交互提供序列建议,通过传统关联规则确定排序。
发明内容
本发明的目的旨在至少解决所述技术缺陷之一。
为此,本发明的一个目的在于提出一种基于协同过滤和建议的个性化医学决定支持系统,其旨在支持肿瘤专家在各个决定结点选择最佳的治疗方案
为了实现上述目的,本发明的实施例提供一种基于协同过滤和建议的个性化医学决定支持系统,其特征在于:包括病历原数据库、定义目标检索模块、建议和检索过滤系统;
所述病历原数据库包含患者的治疗史文件、个人电子病例文件、其他相关文件,所述治疗史文件、所述个人电子病例文件、所述其他相关文件组成高维数特征数据;
所述定义目标检索模块用于通过数据清理将所述病历原数据库中的数据生成患者特征矩阵并转化为检索特征矩阵,传递给建议和检索过滤系统;
所述建议和检索过滤系统将检索特征矩阵进行降维后,创建建议优先顺序表,用于根据选择和设计治疗特定疾病,参考其他类似患者用于治疗副作用研究和/或其它目的。
进一步的,所述个人电子病例文件包括每个患者的病例、病理信息和基因组特征信息,所述病理信息至少包括患者年龄、吸烟史、癌症分期和家族病史;所述基因组特征信息还包括基因组测序结果,用于为给定患者人群模拟不同治疗方案和优化治疗进度。
进一步的,所述其他相关文件至少包括抗癌药物数据库中的基因组学和药物基因组学数据、环境条件、微生物特征,用于搜索更多类似性案例,完善药物对特征数据的响应。
进一步的,所述定义目标检索模块的工作步骤如下:
首先,对病历原数据库内的高维数特征数据进行数据收集和预处理,估算丢失的数据和废弃冗余信息;
其次,生成建议系统后续培训和测试的特征集;
最后,生成检索对象特征矩阵,在检索对象特征矩阵中,每个检索对象都代表一 位患者。
进一步的,所述定义目标检索模块对病历原数据库内的高维数特征数据进行数据收集和预处理的步骤如下:
首先,确定疾病模型;
接着,根据疾病模型,从病历原数据库中检索相关数据;
然后,对来自病历原数据库中的相关数据进行反规范化;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于为朔生物医学有限公司,未经为朔生物医学有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611140089.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种可拆卸的油漆刷
- 下一篇:一种可伸缩式探头清洗刷
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用