[发明专利]对噪声数据进行智能数值分类的方法和系统在审
申请号: | 201811136977.0 | 申请日: | 2018-09-28 |
公开(公告)号: | CN109585023A | 公开(公告)日: | 2019-04-05 |
发明(设计)人: | 陈德铭;周子捷 | 申请(专利权)人: | 皇家飞利浦有限公司 |
主分类号: | G16H50/70 | 分类号: | G16H50/70;G06K9/62 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 王英;刘炳胜 |
地址: | 荷兰艾*** | 国省代码: | 荷兰;NL |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 运算符 多个类别 输出接口 输入接口 分类器 数据处理系统 数据挖掘 数值分类 噪声数据 度量 输出 智能 分类 配置 | ||
一种数据处理系统和相关的方法。所述系统(100)包括输入接口(IN),所述输入接口用于接收要针对目标进行数据挖掘的数据。分类器(CAT)被配置为计算适合于对所述数据进行分类的一个或多个类别运算符。由所述分类器(CAT)对类别运算符的计算包括计算度量。所述系统还包括输出接口(OUT),所述输出接口用于输出这样计算的一个或多个类别运算符。
技术领域
本发明涉及数据处理系统、数据处理方法、数据装置,并且涉及计算机程序单元和计算机可读介质。
背景技术
健康护理行业使用管理系统,诸如心血管信息系统(CVIS)或临床数据存储库(CDR)。
这样的数据管理系统可以记录针对专业领域、诸如心脏科室或其他科室中的患者的大量属性(或性质)。
在这样的数据管理系统中的数据可以由数据分析工具进行分析以找到模式,用于建模和预测性分析。
从申请人的WO2016/030436A1、WO2017/072010A1以及WO2017/072628A1中获知了针对这样的数据的视觉分析和模式发现工具,用于针对域用户以视觉和交互的方式的高级数据分析。在数据中搜索模式是数据挖掘的实例。
模式发现工具可以被用于针对少量(并且甚至稀少)目标的可解释预测性建模,其比例为总数据的低到2%(或者甚至更低)。针对这样的稀少目标的挖掘在现实应用中可能是有用的:在医学领域中稀少但是有用的目标的范例包括:不利心脏事件、不满足关键性能指示符(KPI)的情况以及健康护理中有故障的成像机器。
从历史现实数据中找到针对目标、特别是针对稀疏目标的可解释预测模型是有价值但有挑战的。在心脏科室中具有真实使用案例的一个范例是在患者经历被称为经皮冠状动脉介入术(PCI)以处置狭窄心脏血管之后找到死亡结果的模式。以数据驱动的方式,利用统计学上显著的预测能力发现的死亡结果的模式能够提供超出针对高级临床研究和潜在临床研究的常规领域经验的新(有时惊人)的发现。
为了处理混合数值和类别数据,现有的预测方法或者是通过将所有属性处置为数字而牺牲可解释性,或者是通过仅利用类别属性而牺牲潜在有价值的信息。在将所有属性处置为数字的前一种情况下,如线性或逻辑回归的范例将估计针对从打标签的历史数据获知(训练)的其预测模型中的数值属性的特定系数(权重)。
现有的模式发现系统仅仅利用类别数据属性工作,以便生成可解释的模式。针对数值数据属性,其依赖于具有变换规则的配置模块,所述配置模块利用域知识对其进行分类。例如,能够根据地方临床指南将身体质量指数(BMI)分类为正常或异常。然而,在现实应用中,数值属性未必具有针对分类的已知指南,并且一般的指南可能不捕获数据特定属性。例如,处置狭窄心血管的支架的长度没有任何指南,但是这种信息对于心脏科中预测不利临床结果仍然是有用的。
发明内容
因此,可能需要对数据的经改进的处理。
本发明的目的是由独立权利要求的主题来解决的,其中,在从属权利要求中并入了另外的实施例。应当指出,本发明的下文所描述的方面(“第一方面”)同样适用于数据处理的方法、计算机程序单元和计算机可读介质。
根据本发明的第一方面,提供了一种数据处理系统,包括:
输入接口,其用于接收要针对给定目标的模式进行数据挖掘的数据;
分类器,其被配置为计算一个或多个类别运算符,所述一个或多个类别运算符适合于对所述数据进行分类,其中,所述分类器对所述类别运算符的所述计算包括计算度量;以及
输出接口,其用于输出这样计算的一个或多个类别运算符。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于皇家飞利浦有限公司,未经皇家飞利浦有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811136977.0/2.html,转载请声明来源钻瓜专利网。