[发明专利]一种基于社交媒体数据分析的药物潜在副作用挖掘方法在审
申请号: | 202110596995.2 | 申请日: | 2021-05-31 |
公开(公告)号: | CN113033210A | 公开(公告)日: | 2021-06-25 |
发明(设计)人: | 汤步洲;陈帅;熊英;陈清财 | 申请(专利权)人: | 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F40/242;G06F40/216;G06K9/62;G16H70/40 |
代理公司: | 深圳市君胜知识产权代理事务所(普通合伙) 44268 | 代理人: | 朱阳波 |
地址: | 518000 广东省深圳市南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 社交 媒体 数据 分析 药物 潜在 副作用 挖掘 方法 | ||
本发明公开了一种基于社交媒体数据分析的药物潜在副作用挖掘方法,所述方法包括:获取社交媒体的药物评论数据并对所述药物评论数据进行数据预处理,得到药物评论预处理数据,再基于经过训练的BERT语言模型识别所述药物评论预处理数据的药物副作用实体;基于排序的实体标准化方式将所述药物副作用实体映射到标准副作用概念词典,得到初始药物副作用概念;根据所述初始药物副作用概念和官方报告药物副作用概念,得到潜在药物副作用概念。本发明实施例通过上述方法通过对广大民众最真实的用药体验进行分析,可以得到药物更加全面的潜在副作用信息。
技术领域
本发明涉及人工智能技术领域,尤其涉及的是一种基于社交媒体数据分析的药物潜在副作用挖掘方法。
背景技术
药物安全是病人健康安全的基本组成部分,长期受到医学界和民众的广泛关注。所谓药物副作用(Adverse Drug Reaction,ADR)是指患者服用正常剂量的药物治疗疾病时,观察到的超出预期之外的对患者身体有害的反应。药物副作用涉及的领域非常广泛,包括药物服用成瘾、患者出现耐药性、患者服用药物后出现了非预期的过敏反应和因服用药物导致患者原有的病情加重等情况。一般认为所有药物都有副作用,有些副作用可能具有致命性。
对于药物副作用的及早发现通常有两种渠道,一种是新药上市前制药公司开展的临床试验;第二种是上市后制药公司通过类似疾病预防控制中心的国家卫生系统收集相关药物副作用信息。但根据实际情况来看,仅通过临床试验和官方药物副作用反馈平台来收集与发现药物副作用是远远不够的。一方面,对于制药公司开展的临床试验,由于药物内部构成复杂,患者群体多样性,很难在这个阶段检测到所有可能的副作用。另一方面,新药物上市后,由于官方反馈平台往往效率低,因此很难及时的将搜集到的药物副作用相关信息反馈到对应机构。此外,临床医疗数据涉及到大量隐私信息,获取难度大。
随着Web 2.0技术的发展,社交媒体(如社区、论坛、博客、Wiki等)逐渐在人群中流行,大量互联网用户在社交媒体上的交流产生了大量用户生成内容(User-GeneratedContent,UGC),这些内容极大地丰富了网络世界,这其中就包括部分患者对药物的评论信息。最近几年,随着互联网用户对于药物信息获取的需求逐渐增大,大量的医疗健康类社交网站相继出现,如DailyStrength、AskaPatient、百度病友吧、丁香园等。这些网站聚集了大量的相关人员,在这类网站上他们以发帖或者评论的形式对一些药物发表用药体验,这些社交媒体数据是药物在患者群体的真实写照,对于药物副作用的研究具有重大价值。因此如何从这些医疗健康类社交媒体网站中挖掘药物的潜在副作用信息,逐渐成为药物警戒研究的重要方向之一,越来越受到研究人员的重视。
因此,现有技术还有待改进和发展。
发明内容
本发明要解决的技术问题在于,针对现有技术的上述缺陷,提供一种基于社交媒体数据分析的药物潜在副作用挖掘方法,旨在解决现有技术中存在两方面问题:一方面,对于制药公司开展的临床试验,由于药物内部构成复杂,患者群体多样性,很难在这个阶段检测到所有可能的副作用。另一方面,新药物上市后,由于官方反馈平台往往效率低,因此,很难及时的将搜集到的药物副作用相关信息反馈到对应机构的问题。
本发明解决问题所采用的技术方案如下:
第一方面,本发明实施例提供一种基于社交媒体数据分析的药物潜在副作用挖掘方法,其中,所述方法包括:
获取社交媒体的药物评论数据并对所述药物评论数据进行数据预处理,得到药物评论预处理数据,再基于经过训练的BERT语言模型识别所述药物评论预处理数据的药物副作用实体;其中,所述药物副作用实体用于表征药物副作用的实际描述;
基于排序的实体标准化方式将所述药物副作用实体映射到标准副作用概念词典,得到初始药物副作用概念;所述标准副作用概念词典为所述药物副作用实体与所述初始药物副作用概念的映射关系;所述初始药物副作用概念用于表征药物副作用的名词;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院),未经哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110596995.2/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置