[发明专利]基于医疗问诊对话的患者情感分析方法、系统及计算机设备在审
申请号: | 202111566733.8 | 申请日: | 2021-12-20 |
公开(公告)号: | CN114372142A | 公开(公告)日: | 2022-04-19 |
发明(设计)人: | 戴亚康;戴斌;耿辰;李凤美;周志勇 | 申请(专利权)人: | 中国科学院苏州生物医学工程技术研究所 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/30 |
代理公司: | 北京远大卓悦知识产权代理有限公司 11369 | 代理人: | 韩玲 |
地址: | 215163 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 医疗 问诊 对话 患者 情感 分析 方法 系统 计算机 设备 | ||
本发明公开了一种基于医疗问诊对话的患者情感分析方法、系统及计算机设备,该方法包括:1)采集医疗问诊中患者的问句,进行预处理后形成文本数据集;2)构建数据集合,该数据集合中包括从患者的问句中提取的实体以及与实体关联的情感词;3)构建训练数据集,该训练数据集中,对于每一句话,均对应有其中的实体和实体的情感类别;4)基于bert模型,构建情感分类模型;5)利用情感分类模型对问句进行分析,得到问句中的所有实体的情感类别。本发明能够根据医疗问诊对话实现患者情感状态的自动分类,且本发明针对一句问话中存在多个实体以及多种情感状态的情况,能够实现患者对多个实体的情感状态的分别判断,拓展了其应用场景。
技术领域
本发明涉及智慧医疗领域,特别涉及一种基于医疗问诊对话的患者情感分析方法、系统及计算机设备。
背景技术
在医疗场景下的问诊过程中,往往产生了大量文字记录,这些问答数据包含了问病的详细情况。利用计算机算法对问答的数据进行处理,可以抽取文本中的有效信息,例如对问答进行情感分析,能够判断患者的情感状态,有助于识别患者意图,提高实际业务中的服务能力。
医疗问诊对话中,患者的实际问答中往往会出现多种实体内容,如疾病、手术、症状、用药,不同的实体也会有不同的情感状态。例如“拔牙太疼了,吃点消炎药蛮好的”这句话中,对于拔牙这个手术实体,表现得是负面情绪,而对于消炎药这个实体却是正面情绪。现有的自动化情感分析方案对于这种类型的对话,难以实现针对多种实体的情感状分类。
发明内容
本发明所要解决的技术问题在于针对上述现有技术中的不足,提供一种基于医疗问诊对话的患者情感分析方法、系统及计算机设备。
为解决上述技术问题,本发明采用的技术方案是:一种基于医疗问诊对话的患者情感分析方法,其特征在于,包括:
1)采集医疗问诊中患者的问句,进行预处理后形成文本数据集;
2)对步骤1)得到的文本数据集进行处理得到数据集合,该数据集合中包括从患者的问句中提取的实体以及与实体关联的情感词;
3)对步骤2)得到的数据集合进行人工处理,构建得到训练数据集,该训练数据集中,对于每一句话,均对应有其中的实体和实体的情感类别;
4)基于bert模型,采用步骤3)得到的训练数据集进行训练,最终得到情感分类模型;
5)利用步骤4)得到的情感分类模型对医疗问诊中患者的问句进行分析,得到问句中的所有实体的情感类别。
优选的是,所述步骤1)具体包括:
1-1)采集公开的医疗问诊数据,从中提取患者问病的问句形成问句文本;
1-2)对问句文本进行预处理,去除特殊符号、空格及无法解析的富文本,得到预处理后数据;
1-3)步骤1-2)得到的预处理后数据再进行过滤,去除文本短于预先设定的最短阈值的数据,形成最终的文本数据集。
优选的是,所述步骤2)包括:
2-1)利用医疗实体抽取算法,对步骤1)得到的文本数据集中的所有问句进行实体抽取,得到不同类别的医疗实体;
2-2)利用情感字典,对文本数据集中的所有问句中的具有情感倾向性的词预先进行匹配后抽取;
2-3)对于同一个问句的实体和情感词,建立多对多的关联集合,完成所有问句的处理后,构建得到数据集合。
优选的是,所述步骤3)包括:
3-1)将情感词分为:正面、负面、中性三类,对于数据集合中,每一句问句对应的关联集合内的实体和情感词,人工判断实体对应的情感词类别,正确的关联标为true,视为正样本,错误的标为false,视为负样本;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院苏州生物医学工程技术研究所,未经中国科学院苏州生物医学工程技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111566733.8/2.html,转载请声明来源钻瓜专利网。