[发明专利]用于基于相互相关性进行分层数据分析的方法和装置在审
申请号: | 201580046475.7 | 申请日: | 2015-08-27 |
公开(公告)号: | CN106663144A | 公开(公告)日: | 2017-05-10 |
发明(设计)人: | 周子捷;Q·Z·林;T·M·陈;Y·贾 | 申请(专利权)人: | 皇家飞利浦有限公司 |
主分类号: | G06F19/00 | 分类号: | G06F19/00 |
代理公司: | 永新专利商标代理有限公司72002 | 代理人: | 李光颖,王英 |
地址: | 荷兰艾*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 基于 相互 相关性 进行 分层 数据 分析 方法 装置 | ||
技术领域
本发明总体上涉及基于相关性分析来评估感兴趣数据,尤其是基于海量数据的相关性分析来评估感兴趣临床数据。
背景技术
现今,医院中盛行的电子信息系统使得能够收集海量数据以用于分析。相关性是关键性分析方法以调查所收集的数据之间的相互影响,用于生成对观察、预测、诊断和其他用途有用的新的知识。然而,需要使用不同种类的相关性计算方法来处理从数据类型(例如,数值、标称等)的数据库提取的数据,这对于比较来说是不合适的。此外,如此大量的信息,例如具有每患者的超过200个数据属性的CVIS(心血管信息系统),要求良好设计的结构以向对调查相应特性和影响感兴趣的用户呈现数据和数据之间的相关性。
美国专利2013/0138592A1公开了一种用于海量数据处理的方法,其用于通过使用多个属性来生成关系图并从关系图提取子图以表示假设,其中,相关性是基于数据属性的依赖性分类来生成。此外,相关性值(被表达为p值)被用于统一地表示由不同的统计测试估计的相关性,所述相关性是依赖于有关属性的特定数据类型来决定的。然而,尽管相关性值(被表达为p值)能够根据解决不同假设的各种统计测试生成,但是所谓的统一的相关性值并不反映一致的定量值或假设,并且因此对于比较并不是合理的。依赖性分类确实减少了所提供的相关性,从而增强了用户方便性,但是它们也抑制了对数据类型的潜在依赖性和数据中包含的信息的丢失部分的调查。此外,没有为数据处理提供分层分析,并且所有的数据处理都是在属性水平上执行的,使得分析效率低下且不完整。
美国专利2012/215455A1公开了一种方法,其涉及利用通信模块来接收至少一个位置信号,利用时间戳将从所述位置信号获得的地理空间数据存储在存储器中,并且利用所述通信模块从传感器接收随时间的生物医学信号。利用时间戳将来自所接收的生物信号的生物医学数据存储在所述存储器中。对位置信号的接收和对来自所述位置的地理空间数据的存储在不同的地理位置中进行重复。
“The use of multiple correspondence analysis to explore associations between categories of qualitative variables in healthy ageing”(Patricio Soares Costa等人,Journal of aging research,卷2013,302163,2013年,XP55190591)公开了一种用于在检测和表示用于调查认知老化的大数据集中的下层结构中图示多个对应性分析(MCA)的适用性的研究。
发明内容
因此,期望提供高效的方法和装置来促进对数据的完整调查并以清楚且简单的方式来呈现用户感兴趣的信息。
为了更好的解决这些关心问题中的一个或多个,根据本发明的一个方面的实施例,提供了用于基于相互相关性进行分层数据分析的装置和方法。
一种用于基于相互相关性进行数据分析的装置,所述数据包括多个属性,所述装置包括:
规范化器,其适于将数据集中的每个数据的属性规范化为标称值;
计算器,其适于基于所述属性的经规范化的标称值来计算所述数据集中的每个数据的所述属性之间的相关性;
第一生成器,其适于生成类别以及所述类别之间的相关性的第一图形,每个类别包括基于预定义的规则的经分类的属性,所述类别之间的每个相关性是相应类别的属性之间的平均相关性;或者适于生成推荐的属性的第一图形;
第二生成器,其适于生成由用户从所述第一图形选择的第一属性、有关属性以及所述第一属性与所述有关属性之间的所述相关性的第二图形,所述第一属性与每个有关属性之间的所述相关性高于预定义的相关性阈值;
第三生成器,其适于基于所述第一属性的值和由用户从所述第二图形选择的至少第二属性的值来生成有关数据的统计学分布的第三图形,有关数据包括所述第一属性和至少所述第二属性。
所述统计学分布被呈现在坐标平面中,其中,所述第一属性和至少所述第二属性的属性的每个值组合以及针对每个值组合的对应的统计学结果由坐标轴值和统计指示符的至少有区别的视觉性质来表示,所述统计指示符指示所述第一属性和至少所述第二属性的属性的值组合以及对应于所述值组合的统计学结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于皇家飞利浦有限公司,未经皇家飞利浦有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201580046475.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:M2M本体管理和语义互操作性
- 下一篇:用于个人健康记录系统的通用存取智能卡
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用