[发明专利]一种基于症状相关性对症状降维的分析方法在审
| 申请号: | 201810553989.7 | 申请日: | 2018-06-01 |
| 公开(公告)号: | CN108764360A | 公开(公告)日: | 2018-11-06 |
| 发明(设计)人: | 粘冬晓;杜庆治;张漪;龙华;邵玉斌 | 申请(专利权)人: | 昆明理工大学 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G16H50/80 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 650093 云*** | 国省代码: | 云南;53 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 采集 降维 分析 剔除 降维处理 信息冗余 症状分析 症状信息 冗余 大数据 维度 工作量 数据库 筛选 疾病 医学 | ||
本发明涉及一种基于症状相关性对症状降维的分析方法,属于大数据分析技术领域。本发明包括步骤:首先建立症状发病量数据库;对采集到的症状信息进行筛选处理,即根据所需求的症状剔除不在其中的症状;对症状进行一系列相关性分析;对相关性分析的结果进行判断,比较其与阈值的大小,进行判断是否可以对该症状进行降维。本发明是通过对未知确切疾病的情况下采集症状分析时对冗余的症状进行一个降维处理,有些不需要采集的症状可以剔除,大大的降低了采集过程中的工作量,从而在一定程度上达到减少信息冗余的效果,为后期医学上的复杂分析降低维度。
技术领域
本发明涉及一种基于症状相关性对症状降维的分析方法,属于大数据分析技术领域。
背景技术
随着社会的发展,各种传染病肆虐着人类的身体,给无数的家庭带来了极大痛苦,并且随着社会的进步,人员流动水平和速度逐渐提升,也使得传染病在人们之间的扩散得以加剧,因此有很多部门做出传染病疫情预警的实施方案,但是由于症状的繁多,数据处理起来极为麻烦,因此本基于症状相关性对症状降维的一种分析方法,以提高疫情预警的效果和效率为目的产生。
发明内容
本发明提供了一种基于症状相关性对症状降维的分析方法,本发明通过对未知确切疾病的情况下采集症状分析时对冗余的症状进行降维处理,有些不需要采集的症状可以剔除,大大的降低了采集过程中的工作量,从而在一定程度上达到减少信息冗余的效果,为后期医学上的复杂分析降低维度。
本发明的技术方案是:一种基于症状相关性对症状降维的分析方法,首先建立症状发病量数据库;对采集到的症状信息进行筛选处理,即根据所需求的症状信息剔除不在其中的症状信息;对症状信息进行一系列相关性分析;对相关性分析的结果进行判断,比较其与阈值的大小,进行判断是否可以对该症状进行降维。
所述方法的具体步骤如下:
Step1、建立症状发病量的数据库:收集某地区某段时间内疾病的症状发病量情况建立一个时间轴上的症状发病量信息表;症状发病量信息表包括:症状种类、编号、时间、症状对应的发病数量;
Step2、症状数据预处理:对采集到的疾病症状信息字段,根据所需求的症状信息和收集到的症状信息进行对比,剔除掉无需进行相关性分析的无用症状信息;
Step3、对症状信息进行相关性分析:根据Step2筛选好的症状对应的发病数量,采集到的数据为一段时间内每天各个症对应的数量依次为其中第一个症状X的样本设为第二个症状Y的样本设为第三个症状Z的样本设为……以此类推;当进行分析两种症状的相关性的时候,计算两种症状数据之间的协方差,其计算任意两种症状数据样本协方差的方式一样;当进行多种症状之间的相关性的时候计算多种症状中任意两种症状数据的协方差;计算好的协方差cov(X,Y),如果cov(X,Y)>0则说明此两种症状正相关,如果cov(X,Y)<0则说明此两种症状负相关;然后需要衡量正相关症状的相关性的密切程度,通过计算两种症状之间的相关系数rxy,任意两种症状之间的相关系数的计算方式均相同;
Step4、判断是否可以降维:设定一个阈值h,当症状相关系数rxy>h,则判定此两种症状相关性极高,可以对症状进行降维,否则不进行降维。
所述步骤Step3中,对Step3中两种症状样本X、Y进行协方差计算公式为:
其中分别为样本X,Y的均值。
所述具体步骤Step3中,对Step3中两种症状进行相关系数的计算公式为:
其中cov(X,Y)为样本X,Y的协方差,计算公式为:
其中Sx为样本X的标准差,计算公式为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810553989.7/2.html,转载请声明来源钻瓜专利网。





