[发明专利]一种基于关键词搜索时间序列的传染病疫情预测与监控系统、方法及其应用在审
申请号: | 202010131044.3 | 申请日: | 2020-02-28 |
公开(公告)号: | CN113327682A | 公开(公告)日: | 2021-08-31 |
发明(设计)人: | 秦迎梅;门聪 | 申请(专利权)人: | 天津职业技术师范大学(中国职业培训指导教师进修中心) |
主分类号: | G16H50/80 | 分类号: | G16H50/80;G06F16/9535;G06N20/00 |
代理公司: | 天津创智天诚知识产权代理事务所(普通合伙) 12214 | 代理人: | 李薇 |
地址: | 300222 天*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 关键词 搜索 时间 序列 传染病 疫情 预测 监控 系统 方法 及其 应用 | ||
1.一种基于关键词搜索时间序列的传染病疫情预测与监控系统,其特征在于,包括搜索关键词筛选模块、搜索热度指数网络请求模块和机器学习预测模块,其中:
所述搜索关键词筛选模块用于生成与传染病疫情相关的相关关键词;
所述搜索热度指数网络请求模块用于通过搜索引擎接口获取所述相关关键词对应的搜索热度;
所述机器学习预测模块基于历史数据训练回归模型,并基于新的数据进行预测。
2.如权利要求1所述的基于关键词搜索时间序列的传染病疫情预测与监控系统,其特征在于,所述机器学习预测模块部署于云端,所述机器学习预测模块利用python flask框架进行服务器后端部署,搭建http服务。
3.如权利要求1所述的基于关键词搜索时间序列的传染病疫情预测与监控系统,其特征在于,服务器端开放端口处理互联网传输的请求,互联网的请求通过http协议完成。
4.如权利要求1所述的基于关键词搜索时间序列的传染病疫情预测与监控系统的预测监控方法,其特征在于,包括机器学习预测模块训练阶段和机器学习预测模块预测阶段,其中:所述机器学习预测模块预测阶段包括以下步骤:
步骤S1,在所述搜索关键词筛选模块中,选取与传染病发作症状相关联的关键词作为相关关键词,组成关键词表;
步骤S2,在搜索热度指数网络请求模块中,输入步骤S1中的所述相关关键词,通过搜索引擎接口获取所述相关关键词在实验时间段内对应的搜索热度指数;
步骤S3,数据预处理:把搜索热度指数均值低于热度阈值的相关关键词过滤掉,计算所述关键词与其搜索热度指数之间的相关系数,并将相关系数低于相关系数阈值的相关关键词过滤掉;
步骤S4,将步骤S3预处理后的所述相关关键词输入经过训练的所述机器学习预测模块,进行预测,产出预测结果,获得预测日的新增病例数量。
5.如权利要求4所述的预测监控方法,其特征在于,所述步骤S3中的热度阈值为500,相关系数阈值为0.4-0.6。
6.如权利要求4所述的预测监控方法,其特征在于,所述机器学习预测模块训练阶段包括以下步骤:
步骤1,在所述搜索关键词筛选模块中,选取与传染病发作症状相关联的关键词作为相关关键词,组成关键词表;
步骤2,在搜索热度指数网络请求模块中,输入步骤1中的所述相关关键词,通过搜索引擎接口获取所述相关关键词在实验时间段内对应的搜索热度指数;
步骤3,数据预处理:把搜索热度指数均值低于热度阈值的相关关键词过滤掉,计算所述关键词与其搜索热度指数之间的相关系数,并将相关系数低于相关系数阈值的相关关键词过滤掉;
步骤4,获取实验时间段内,每日新增病例数量;
步骤5,建立训练样本:假设第T日的新增传染病确诊人数与前m日的相关关键词的搜索量存在关联关系,即每个样本的特征包含T-m日到T-1日预处理后的每个相关关键词的检索量,设每日有n个相关关键词,另外增加T-m日到T-1日每日新增病例为特征,每个样本包含m(n+1)个特征,每个样本的目标值为第T日的新增病例数量,通过滑动时间窗的方法在目标时间段获得多组样本,所述时间窗的窗长为m天,样本数量=总时间长度-时间窗长+1,每个样本的目标值为第T日的真实新增病例数量,如果使用模型预测未来第N天的新增病例数量,则每个样本的目标值为第T+N日的真实新增病例数量;
基于训练样本数据建立回归模型,模型采用lasso回归模型,求解回归系数的目标函数中使用的惩罚函数是L1范数:
y=θX+e
y为预测第N天的新增病例数量,X为输入的特征向量,e为预测误差,通过训练样本数据训练θ向量,使lasso损失函数最小;Lasso回归损失函数表达式:
L1=argmin||y-θX||+λ||θ||。
7.如权利要求6所述的预测监控方法,其特征在于,λ为为0.1或自定义数值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津职业技术师范大学(中国职业培训指导教师进修中心),未经天津职业技术师范大学(中国职业培训指导教师进修中心)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010131044.3/1.html,转载请声明来源钻瓜专利网。