[发明专利]一种基于本体的医疗纠纷案件舆情预警等级的预测方法有效
申请号: | 202010374635.3 | 申请日: | 2020-05-06 |
公开(公告)号: | CN111581982B | 公开(公告)日: | 2023-02-17 |
发明(设计)人: | 刘杰;张凯;周建设;史金生;骆力明;冀俊宇;陈瑶 | 申请(专利权)人: | 首都师范大学 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/284;G06F40/216;G06F16/36;G06F16/35;G06F16/33 |
代理公司: | 南昌华成联合知识产权代理事务所(普通合伙) 36126 | 代理人: | 徐苍 |
地址: | 100048 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 本体 医疗 纠纷案件 舆情 预警 等级 预测 方法 | ||
1.一种基于本体的医疗纠纷案件舆情预警等级的预测方法,其特征在于:先进行医疗纠纷案件的本体构建,然后进行舆情预警等级预测;
所述医疗纠纷案件的本体构建包括以下过程:
过程一、确定案件要素;
过程二、分析案件要素间的语义关系,通过对案件要素以及案件舆情预警等级的分析,划分等级;
过程三、定义推理规则,推理医疗事故等级;
过程四、根据过程一、过程二和过程三构建医疗纠纷案件本体;
所述舆情预警等级预测包括以下步骤:
步骤一、使用词语编码的算法对舆情预警等级的预测模型进行训练;词语编码的算法采用基于Word2vec与支持向量机相结合的医疗纠纷案件舆情预警等级的预测方法,方法如下:先对文本进行分词,以词为单位,将百科小说使用Word2vec模型进行训练,将词语匹配到的模型训练得到的词向量作为该词语的词向量进行文本表示;
步骤二、使用句子编码的算法对舆情预警等级的预测模型进行训练;句子编码的算法采用基于TextRank算法与支持向量机相结合的医疗纠纷案件舆情预警等级的预测方法,方法如下:默认每个句子和其他所有的句子都是有链接关系的,然后计算权重,将每个句子链接的权重加在一起作为此句子在文本中的权重,通过统计文本数据的句子数量和句子中词语数量,作为特征输入到支持向量机中做分类;
步骤三、将本体结构中的案件要素分配权重与词语编码、句子编码结合在一起,对舆情预警等级的预测;采用的方法是将本体结构中出现案件要素的句子分配权重,然后在文本数据中以句子为单位进行查找匹配,将赋有权重后的句子向量作为特征输入,使用支持向量机进行分类。
2.根据权利要求1所述的一种基于本体的医疗纠纷案件舆情预警等级的预测方法,其特征在于:所述医疗纠纷案件的本体构建包括以下过程:
过程一、确定案件要素,确定舆情预警等级、医方过错、造成患者后果、过错占比和医疗事故等级共5个案件要素;
过程二、分析案件要素间的语义关系,通过对案件要素以及案件舆情等级的分析,得出医方过错、造成患者后果、过错占比和医疗事故等级都会影响舆情预警等级,舆情预警等级根据严重程度分为特重、重度、中度、轻度四个等级;
过程三、定义推理规则,根据医疗事故的定义以及侵权责任法和医疗事故处理条例,通过医方过错、造成患者后果来推理医疗事故等级;
过程四、根据过程一、过程二和过程三使用protégé 4.2构建医疗纠纷案件本体。
3.根据权利要求1所述的一种基于本体的医疗纠纷案件舆情预警等级的预测方法,其特征在于:所述Word2vec的训练模型有两种,即Skip-Gram和CBOW,Skip-Gram是通过目标词来预测与其相关的上下文,即随机从语料库里面抽取多个词,然后通过概率计算为目标词找到与其语义相接近的词语,百科的训练模型选取Skip-Gram进行训练;
在百科的训练模型中匹配到词语的词向量是128维的,之后对每个案件文本的词语数量进行统计,取中间值300作为定长,形成[300,128]的向量矩阵,将向量矩阵作为特征输入,使用支持向量机来做分类。
4.根据权利要求1所述的一种基于本体的医疗纠纷案件舆情预警等级的预测方法,其特征在于:所述步骤二中句子编码的算法采用基于TextRank算法与支持向量机相结合的医疗纠纷案件舆情预警等级的预测方法。
5.根据权利要求4所述的一种基于本体的医疗纠纷案件舆情预警等级的预测方法,其特征在于:所述TextRank算法的公式如下:
。
6.根据权利要求5所述的一种基于本体的医疗纠纷案件舆情预警等级的预测方法,其特征在于:所述步骤二中在计算每个句子给它链接句的贡献的时候,是计算权重占总权重的比例来分配。
7.根据权利要求6所述的一种基于本体的医疗纠纷案件舆情预警等级的预测方法,其特征在于:所述权重是指两个句子的相似程度,根据余弦相似度算法,创建相似矩阵并计算句子间相似度。
8.根据权利要求7所述的一种基于本体的医疗纠纷案件舆情预警等级的预测方法,其特征在于:在对一篇文章进行摘要的时候,默认每个句子和其他所有的句子都是有链接关系的,然后计算权重,将每个句子链接的权重加在一起作为此句子在文本中的权重,之后分别统计每个案件文本中句子的数量,以及句子中词语的数量,取中间值,最终句子数取12,词语数取50,形成三维向量矩阵[12,50,128],作为特征输入到支持向量机中做分类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于首都师范大学,未经首都师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010374635.3/1.html,转载请声明来源钻瓜专利网。