[发明专利]问卷生成方法、分类模型的训练方法、装置和计算机设备在审
申请号: | 202110277051.9 | 申请日: | 2021-03-15 |
公开(公告)号: | CN112927771A | 公开(公告)日: | 2021-06-08 |
发明(设计)人: | 任科;牛梓权;苏航;孙宗涛;伍美婷;汝玲 | 申请(专利权)人: | 北京药明津石医药科技有限公司 |
主分类号: | G16H10/20 | 分类号: | G16H10/20;G06F16/33;G06F16/35 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 方高明 |
地址: | 100020 北京市朝*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 问卷 生成 方法 分类 模型 训练 装置 计算机 设备 | ||
本申请涉及一种问卷生成方法、分类模型的训练方法、装置、计算机设备和存储介质。所述方法包括:获取临床试验招募数据;将临床试验招募数据输入第一分类模型,根据第一分类模型的分类结果确定临床试验招募数据的适应症类型;将临床试验招募数据输入对应的适应症类型的第二分类模型,得到适应症类型对应的临床试验招募数据中入排标准对应的结构化字段和问题关键词;根据结构化字段和问题关键词,在题目数据库中抽取问卷问题题目,根据每一问题题目对应的题目格式,生成调查问卷。采用本方法能够提高招募临床试验受试者的效率。
技术领域
本申请涉及临床试验技术领域,特别是涉及一种问卷生成方法、分类模型的训练方法、装置、计算机设备和存储介质。
背景技术
随着临床试验技术的发展,出现了越来越多的临床试验项目,针对临床试验项目所需的受试者,传统的方式中采用面对面沟通的方式获取受试者的特征信息,或者,针对每一临床试验项目根据其多条入排标准人工制定调查问卷收集受试者的特征信息。
然而,传统方式中受试者的特征信息收集方式均需要花费大量人力成本,且对应的招募临床试验受试者的效率低下。
发明内容
基于此,有必要针对上述技术问题,提供一种问卷生成方法、分类模型的训练方法、装置、计算机设备和存储介质。
一种问卷生成方法,所述方法包括:
获取临床试验招募数据;
将所述临床试验招募数据输入第一分类模型,根据所述第一分类模型的分类结果确定所述临床试验招募数据的适应症类型;
将所述临床试验招募数据输入对应的适应症类型的第二分类模型,得到所述适应症类型对应的临床试验招募数据中入排标准对应的结构化字段和问题关键词;
根据所述结构化字段和所述问题关键词,在题目数据库中抽取问卷问题题目,根据每一所述问题题目对应的题目格式,生成调查问卷。
在其中一个实施例中,所述获取临床试验招募数据,包括:
获取待处理的临床试验招募文本数据;
将待处理的所述临床试验招募文本数据通过训练好的词向量化模型进行向量化处理,得到所述临床试验招募文本数据的向量化结果,将所述向量化结果作为所述临床试验招募数据。
一种分类模型的训练方法,其特征在于,所述方法包括:
获取第一临床试验招募训练样本,所述第一临床试验招募训练样本中包含每一临床试验招募训练数据的整句向量化值;
将所述第一临床试验招募训练样本中的整句向量化值输入至分类模型中,通过所述分类模型得到初始分类结果;
根据所述第一临床试验招募训练样本携带的适应症类别标签和适应症细分特征标签对应的基准分类结果对所述初始分类结果进行验证,若所述初始分类结果与所述基准分类结果不一致,则对所述分类模型进行模型参数调整。
在其中一个实施例中,所述获取第一临床试验招募训练样本,包括:
获取临床试验招募文本数据;
根据词向量化模型以及预设的加权平均算法,得到每一条所述临床试验招募文本数据的整句向量化值;
根据分类基准向量化值,对所述临床试验招募数据进行分类处理,得到所述临床试验招募文本数据的整句向量化值的分类结果;
针对每一所述分类结果进行适应症类别和适应症细分特征的标注,得到携带所述适应症类别标签和所述适应症细分特征标签的第一临床试验招募训练样本。
一种分类模型的训练方法,所述方法包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京药明津石医药科技有限公司,未经北京药明津石医药科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110277051.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种齿轮生产用退火设备
- 下一篇:一种固定式南瓜除皮装置及其除皮方法