[发明专利]一种基于分层策略的药品不良反应数据遮蔽效应消除方法有效
申请号: | 201810309834.9 | 申请日: | 2018-04-09 |
公开(公告)号: | CN108565029B | 公开(公告)日: | 2021-12-21 |
发明(设计)人: | 魏建香;丁玥;倪霏;朱云霞 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G16H70/40 | 分类号: | G16H70/40 |
代理公司: | 南京苏科专利代理有限责任公司 32102 | 代理人: | 姚姣阳 |
地址: | 210003 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 分层 策略 药品 不良反应 数据 遮蔽 效应 消除 方法 | ||
1.一种基于分层策略的药品不良反应信号检测中数据遮蔽效应的消除方法,其特征在于,所述方法包括以下步骤:
1)ADR数据的采集与预处理:其中ADR数据的采集包括原始ADR数据采集并建立原始ADR数据库以及已知数据的采集建立已知数据库,数据的预处理是指将原始ADR报告中多药品、多不良反应的报告拆分为一对一的单一对应关系,并删除数据中药品名称或不良反应名称为“不详”的记录以及出现频次小于3的ADR报告数据;
2)数据的分层处理:将步骤1)处理后的ADR数据库中所含的药品不良反应报告进行预处理,对预处理后的ADR数据进行分层处理;所述的数据的分层处理程序,是根据所拥有的数据规模从药品出现频次、不良反应出现频次、药品不良反应对的出现频次三个层面对数据进行等频的分层处理,最终分为27组数据集,保证每组数据中药品-不良反应对出现的频次均处于同一个数量级上,包括如下具体步骤:
2.1)按照药品出现频次分层:
依据ADR报告数据,利用Microsoft Visual FoxPro 6.0对每种药品出现的频次进行数据分布统计,根据出现频次以及报告总体数量,对数据进行等频等深分3层,使得每层中所拥有的报告数量大致相等,将分层后的数据集记为Drug Group1、Drug Group2、DrugGroup3;
2.2)按照不良反应出现频次分层:
对步骤2.1)中所述3层,分别进行不良反应出现频次的数据分布统计,根据ADR出现频次以及该层次的报告总数,再次对数据进行等频分3层,使得每层中所拥有的报告数量大致相等,最终Drug Group1按照不良反应出现频次分为3层,记为ADR Group1-1、ADR Group1-2、ADR Group1-3,类似地Drug Group2和Drug Group3按照不良反应出现频次区间,分为ADRGroup2-1、ADR Group2-2、ADR Group2-3和ADR Group3-1、ADR Group3-2、ADR Group3-3;
2.3)按照药品-不良反应对出现频次分层:
经过2.1)以及2.2)步骤的分层,此时已经得到了9组数据集;最后在这9组数据中进行药品-不良反应对出现频次的统计,结合各组数据中的报告总量,依次进行等频划分,如此进行下去,最终得到27组数据集,记为Drug-ADR Group 1-1-1、Drug-ADR Group 1-1-2、Drug-ADR Group 1-1-3……Drug-ADR Group 3-3-1、Drug-ADR Group 3-3-2、Drug-ADRGroup 3-3-3;
3)数据的信号检测:对分层前后的数据,通过ADR信号检测方法进行信号检测;
4)数据遮蔽效应消除有效性评价:借助已知数据库来判断分层前后信号检测的效果,采用精度Precision、召回率Recall以及F度量作为评价指标。
2.根据权利要求1所述的一种基于分层策略的药品不良反应信号检测中数据遮蔽效应的消除方法,其特征在于:所述步骤4)数据遮蔽效应消除有效性评价步骤中的有效性评价过程如下:
4.1)信号标注:借助已知数据库中药品-不良反应组合对分层前后信号检测结果进行标注,
若该组合在已知数据库中存在则标注为1,否则标注为0;
4.2)设计基于已知数据库的列联表:
所述列联表元素分别为TP、FN、FP、TN;其中TP代表已知的药品-不良反应信号被准确检测为阳性信号的数量,即真阳性,FN代表已知的药品-不良反应信号被检测为阴性信号的数量,即假阴性,FP表示未知的药品-不良反应信号被检测为阳性信号的数量,即假阳性,TN表示未知的药品-不良反应信号被检测为阴性信号的数量,即真阴性;
4.3)评价指标计算:
精度(precision)是精确性度量的指标,即标记为阳性的元组实际为阳性所占的百分比;
召回率(recall)是完全性的度量,即阳性元组标记为阳性所占的百分比;
精度和召回率之间趋向于呈现逆关系,有可能以降低一个为代价而提高另一个;F度量将精度和召回率组合到一个度量中,定义如下:
比较分层前后上述三个指标值的大小,若指标值提高,则说明数据遮蔽效应在一定程度上有所削减,一些可疑的药品-不良反应信号对通过分层的方法被检测出来,反馈给医疗机构、药品监管部门进行进一步地临床验证。
3.根据权利要求2所述的一种基于分层策略的药品不良反应信号检测中数据遮蔽效应的消除方法,其特征在于:所述原始ADR数据库为国家中心的ADR数据,已知数据库包含了目前已知药品及其对应的不良反应,原始ADR数据从国家药品不良反应监测中心获得;所参考的已知数据库是从网络中采集了相关药物说明书、国家食品药品监督管理局发布的各期药品不良反应信息通报以及药物警戒快讯和各种法规文件来建立的ADR数据库,其中包含了目前已知的药品及其导致的不良反应。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810309834.9/1.html,转载请声明来源钻瓜专利网。