[发明专利]一种基于神经网络语言模型的药物潜在不良反应发现方法有效

专利信息
申请号: 201910039475.4 申请日: 2019-01-16
公开(公告)号: CN109767817B 公开(公告)日: 2023-05-30
发明(设计)人: 王理;姜磊;施维;张远鹏 申请(专利权)人: 南通大学
主分类号: G16C20/50 分类号: G16C20/50;G16C20/70;G06F16/31;G06F16/35
代理公司: 南通创硕专利商标代理事务所(普通合伙) 32733 代理人: 王肖林
地址: 226500 *** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要: 一种基于神经网络语言模型的药物潜在不良反应发现方法,涉及药物潜在不良反应发现方法领域,包括以下步骤,数据获取及清洗;模型优化,修改原始的Skip‑gram算法,用于从FDA的AERS报告和DrugBank DDI数据集中进行特征提取;拓展相互作用库,选取5种不良反应大类:肾损伤、心脏毒性、肝毒性、血压异常和神经毒性,以这5种不良反应大类作为Logistic回归验证药物、不良反应向量的范围并在这5大类范围内拓展DrugBank药物相互作用库;Logistic回归验证向量效果,使用Scikit‑learn完成CM‑TF‑IDF模型构建及分布式向量生成。该基于神经网络语言模型的药物潜在不良反应发现方法,解决了现有的方法数据处理速度较慢,不适合处理大规模数据集,同时不能快速进行特征学习的问题。
搜索关键词: 一种 基于 神经网络 语言 模型 药物 潜在 不良反应 发现 方法
【主权项】:
1.一种基于神经网络语言模型的药物潜在不良反应发现方法,其特征在于,包括以下步骤,(1)数据获取及清洗,首先,以XML格式存在AERS报告被抽取存储到7个独立的数据表中并加载到PostgreSQL数据库中,其次,使用患者年龄、性别、地市和案例日期字段组成样例表,2012年以前的AERS报告被称为LAERS数据,而2012年以后的AERS报告被称为FAERS数据,独立的键值表示在这两者中同时出现的案例,然后进行重复数据删除逻辑清洗重复数据;(2)模型优化,修改原始的Skip‑gram算法,用于从FDA的AERS报告和DrugBank DDI数据集中进行特征提取;(3)拓展相互作用库,选取5种不良反应大类:肾损伤、心脏毒性、肝毒性、血压异常和神经毒性,以这5种不良反应大类作为Logistic回归验证药物、不良反应向量的范围并在这5大类范围内拓展DrugBank药物相互作用库;(4)Logistic回归验证向量效果,使用Scikit‑learn完成CM‑TF‑IDF模型构建及分布式向量生成。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南通大学,未经南通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201910039475.4/,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top