[发明专利]一种基于神经网络语言模型的药物潜在不良反应发现方法有效
申请号: | 201910039475.4 | 申请日: | 2019-01-16 |
公开(公告)号: | CN109767817B | 公开(公告)日: | 2023-05-30 |
发明(设计)人: | 王理;姜磊;施维;张远鹏 | 申请(专利权)人: | 南通大学 |
主分类号: | G16C20/50 | 分类号: | G16C20/50;G16C20/70;G06F16/31;G06F16/35 |
代理公司: | 南通创硕专利商标代理事务所(普通合伙) 32733 | 代理人: | 王肖林 |
地址: | 226500 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于神经网络语言模型的药物潜在不良反应发现方法,涉及药物潜在不良反应发现方法领域,包括以下步骤,数据获取及清洗;模型优化,修改原始的Skip‑gram算法,用于从FDA的AERS报告和DrugBank DDI数据集中进行特征提取;拓展相互作用库,选取5种不良反应大类:肾损伤、心脏毒性、肝毒性、血压异常和神经毒性,以这5种不良反应大类作为Logistic回归验证药物、不良反应向量的范围并在这5大类范围内拓展DrugBank药物相互作用库;Logistic回归验证向量效果,使用Scikit‑learn完成CM‑TF‑IDF模型构建及分布式向量生成。该基于神经网络语言模型的药物潜在不良反应发现方法,解决了现有的方法数据处理速度较慢,不适合处理大规模数据集,同时不能快速进行特征学习的问题。 | ||
搜索关键词: | 一种 基于 神经网络 语言 模型 药物 潜在 不良反应 发现 方法 | ||
【主权项】:
1.一种基于神经网络语言模型的药物潜在不良反应发现方法,其特征在于,包括以下步骤,(1)数据获取及清洗,首先,以XML格式存在AERS报告被抽取存储到7个独立的数据表中并加载到PostgreSQL数据库中,其次,使用患者年龄、性别、地市和案例日期字段组成样例表,2012年以前的AERS报告被称为LAERS数据,而2012年以后的AERS报告被称为FAERS数据,独立的键值表示在这两者中同时出现的案例,然后进行重复数据删除逻辑清洗重复数据;(2)模型优化,修改原始的Skip‑gram算法,用于从FDA的AERS报告和DrugBank DDI数据集中进行特征提取;(3)拓展相互作用库,选取5种不良反应大类:肾损伤、心脏毒性、肝毒性、血压异常和神经毒性,以这5种不良反应大类作为Logistic回归验证药物、不良反应向量的范围并在这5大类范围内拓展DrugBank药物相互作用库;(4)Logistic回归验证向量效果,使用Scikit‑learn完成CM‑TF‑IDF模型构建及分布式向量生成。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南通大学,未经南通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910039475.4/,转载请声明来源钻瓜专利网。