[发明专利]一种基于生成式对话技术的医疗问答系统在审
申请号: | 202110307807.X | 申请日: | 2021-03-23 |
公开(公告)号: | CN113012822A | 公开(公告)日: | 2021-06-22 |
发明(设计)人: | 孙长银;王浩;董璐;葛泉波 | 申请(专利权)人: | 同济大学 |
主分类号: | G16H80/00 | 分类号: | G16H80/00;G06F16/332;G06F16/35;G06N3/04;G06N3/08 |
代理公司: | 上海德昭知识产权代理有限公司 31204 | 代理人: | 郁旦蓉 |
地址: | 200092 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 生成 对话 技术 医疗 问答 系统 | ||
1.一种基于生成式对话技术的医疗问答系统,用于针对患者输入的问题文本生成相应的回复文本,其特征在于,包括:
科室分类模块,利用预先训练好的科室分类模型对所述问题文本进行分类得到科室编码向量;
科室编号生成模块,将所述科室编码向量根据字典转化得到与科室相对应的第一编号向量,将所述问题文本根据所述字典转化得到第二编号向量,将所述第一编号向量与所述第二编号向量进行拼接得到拼接编号向量;以及
回复文本生成模块,将所述拼接编号向量输入预先训练好的生成式对话模型中,生成所述回复文本,
其中,所述科室分类模型以及所述生成式对话模型的训练过程包括如下步骤:
步骤S1,获取至少包括问题内容与医生答复的医疗问答数据集,对该医疗问答数据集进行整理,从而得到所述问题内容与所述医生答复相对应存储的组合数据;
步骤S2,将所述组合数据中的问题内容作为预先搭建好的科室学习模型的输入,并将该问题内容所属的科室作为科室标签,从而训练得到用于将患者问题分类到具体科室的科室分类模型;
步骤S3,将所述问题内容输入所述科室分类模型得到预测科室名称,并将该预测科室名称与对应的问题内容拼接得到拼接文本;
步骤S4,将所述拼接文本输入预先搭建好的回复文本学习模型,并将所述医生答复作为答复标签,从而训练得到所述生成式对话模型。
2.根据权利要求1所述的基于生成式对话技术的医疗问答系统,其特征在于:
其中,所述步骤S1包括如下子步骤:
步骤S1-1,获取至少包括所述问题内容与所述医生答复医疗问答数据集,并删除内容缺失或存在歧义的数据,从而得到精选数据集;
步骤S1-2,对所述精选数据集中每条数据的所述问题内容按照对应的科室进行标记,得到所述问题内容与所述医生答复相对应存储的组合数据。
3.根据权利要求1所述的基于生成式对话技术的医疗问答系统,其特征在于:
其中,所述步骤S2包括如下子步骤:
步骤S2-1,利用所述字典将所述问题内容中每个字转化为相应的数字形式的编号作为文字编号;
步骤S2-2,所述科室学习模型中的编码器将所述文字编号组成的向量转化为带有上下文语意信息的问题内容向量化表示作为问题向量表示;
步骤S2-3,所述科室学习模型中的全连接层根据所述问题向量表示进行分类,得到分类结果向量,用于表示所述问题内容对应所有科室的概率,将其中概率最大的科室作为分类预测结果;
步骤S2-4,基于所述分类预测结果以及所述科室标签的交叉熵损失loss通过基于梯度下降法的反向传播进行训练更新,从而训练得到用于将患者问题分类到具体科室的科室分类模型,
式中,n为所述科室的总类别数,pi(x)为所述科室标签,qi(x)为所述分类向量中的第i位的数值,即所述科室学习模型预测的属于当前科室的概率。
4.根据权利要求1所述的基于生成式对话技术的医疗问答系统,其特征在于:
其中,所述科室编码向量由One-Hot编码方法得到。
5.根据权利要求1所述的基于生成式对话技术的医疗问答系统,其特征在于:
其中,所述科室分类模型为Bert模型,
所述生成式对话模型为基于Transformer架构的Bert-GPT模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济大学,未经同济大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110307807.X/1.html,转载请声明来源钻瓜专利网。