[发明专利]一种基于隐语义模型的中医组方推荐方法及系统有效
| 申请号: | 202010279991.7 | 申请日: | 2020-04-10 |
| 公开(公告)号: | CN111477295B | 公开(公告)日: | 2022-06-03 |
| 发明(设计)人: | 李巧勤;巩小强;刘勇国;杨尚明 | 申请(专利权)人: | 电子科技大学 |
| 主分类号: | G16H20/10 | 分类号: | G16H20/10;G16H20/90;G16H50/70;G06F40/30;G06F16/335;G06F16/31 |
| 代理公司: | 成都行之专利代理事务所(普通合伙) 51220 | 代理人: | 李朝虎 |
| 地址: | 610000 四川省成*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 隐语 模型 中医 推荐 方法 系统 | ||
1.一种基于隐语义模型的中医组方推荐方法,其特征在于,该方法包括以下步骤:
S0:采集某种疾病的多例医案信息,医案信息包括医案数及每例医案对应症状和药物;
S1:根据步骤S0采集的信息,基于对医案库中症状和对应处方的隐语义分析,提取出隐含证候,发现隐含证候、症状和药物间存在的关系,建立基于症状-证候-药物的主题模型,并进行参数学习训练;
S2:输入待检测的用户症状,从基于症状-证候-药物的主题模型结果中获取的症状、证候、药物之间的对应关系,进行相应处方推荐,并输出推荐结果,为医生诊疗过程的组方提供参考和辅助决策;
所述步骤S1具体包括基于症状-证候-药物的主题模型的生成;
假设一例医案被视为一篇文档,一种证候被视为一个主题;令|P|为临床医案数,每例医案p包含种症状和种药物,hpn为医案p中的第n种药物,spm为医案p中的第m种症状,zpmn为词hpn和spm的潜在证候分布;K为证候主题数,每个主题k∈[1,…,K]表示一种证候;为证候k∈[1,…,K]上S维的证候-症状多项式分布,用于描述不同症状对证侯的重要性,其中,S为医案集包含的症状总数;为证候k∈[1,…,K]上H维的证候-药物多项式分布,用于描述不同药物治疗一种证侯的重要性,其中,H为医案集包含的药物总数;对于某种证候下的所有词,假设和相互独立;θp为医案p上K维的医案-证候多项式分布;x为二元变量值,取值范围为{symptom,herb},以此来表达所生成词的2种不同类型,若x=symptom,则表示所生成词为症状,否则为药物;α、β、γ分别为Dirichlet先验分布的超参数;基于症状-证候-药物主题模型SSHTM的生成过程如下所示:
步骤1:对于每个主题k∈[1,…,K],服从参数为β的狄利克雷先验分布,服从参数为γ的狄利克雷先验分布:
步骤2:对于每例医案p∈P,θp服从参数为α的狄利克雷先验分布:θp~Dirichlet(α);
步骤3:对于包含于每例医案p中的每个词,主题zpmn服从参数为θp的多项式分布:zpmn~Multi(θp);
步骤4:若x=symptom,则症状spm服从参数为的多项式分布:若x=herb,则药物hpn服从参数为的多项式分布:
所述步骤S1还包括基于症状-证候-药物的主题模型的参数学习训练;
其中,参数θpk、及的计算分别如下:
其中,θpk表示医案p包含证候k的概率,表示证候k包含症状s的概率,表示证候k包含药物h的概率;表示医案p的症状分配给主题k的次数,表示医案p的药物分配给主题k的次数,表示在医案集中症状m分配给主题k的次数,表示在医案集中药物n分配给主题k的次数;
所述步骤S2中对输入的待检测用户的症状,进行预处理,将其表示为一个n维向量,n为包含于医案集的症状数;其中,每种症状用0、1编码表示,若输入症状存在,则编码为1,否则为0;
所述步骤S2具体包括如下子步骤:
S21:构建症状-药物矩阵,获取症状与药物之间的对应关系;
构建症状-药物矩阵,其第i行j列的元素表示为p(hj|si),即治疗症状si的药物包含hj的概率,其计算如下所示:
其中,z为基于症状-证候-药物的主题模型中的证候主题,K为主题数,p(hj|z)即为SSHTM模型中的参数p(z|si)表示症状si包含于证候z的概率:
其中,p(si|z)为SSHTM模型中的参数p(si)表示症状si在医案集M中的出现频率,p(z)为主题z的先验概率,将其看作为一个常数;
S22:对所有症状计算每种药物的排序值Rank,并选择具有较大排序值的药物作为其推荐药物,并将这些推荐药物的组合作为治疗患者的推荐处方;
S221:基于输入的患者症状及其对应权重,计算所有症状下每种药物的排序值Rank,其计算如下所示:
其中,weight(si)表示症状si的权重,若输入症状包含si,则为1,否则为0;
S222:对所有药物的Rank值进行降序排列,并选择前N个药物作为其推荐药物,并将这N个药物的组合作为治疗患者症状的推荐处方,记为:pres.={H(N)}。
2.一种基于隐语义模型的中医组方推荐系统,其特征在于,该系统支持上述权利要求1所述的一种基于隐语义模型的中医组方推荐方法,包括:
医案信息采集模块:用于采集某种疾病的多例医案信息,医案信息包括医案数及每例医案对应症状和药物;
基于症状-证候-药物的主题模型构建及训练模块:连接医案信息采集模块,基于对医案中症状和对应处方的隐语义分析,提取出隐含证候,发现隐含证候、症状和药物间存在的关系,建立基于症状-证候-药物的主题模型,并进行模型训练及保存;
用户信息输入模块:用于获取待检测用户的症状,并进行预处理相关解析;
中医组方推荐模块:分别连接用户信息输入模块和基于症状-证候-药物的主题模型构建及训练模块,用于根据输入待检测用户的症状,从基于症状-证候-药物的主题模型结果中获取的症状、证候、药物之间的对应关系,进行相应处方推荐,并输出推荐结果,为医生诊疗过程的组方提供参考和辅助决策;
所述基于症状-证候-药物的主题模型构建及训练模块包括模型生成单元,模型生成单元包括:
假设一例医案被视为一篇文档,一种证候被视为一个主题;令|P|为临床医案数,每例医案p包含种症状和种药物,hpn为医案p中的第n种药物,spm为医案p中的第m种症状,zpmn为词hpn和spm的潜在证候分布;K为证候主题数,每个主题k∈[1,…,K]表示一种证候;为证候k∈[1,…,K]上S维的证候-症状多项式分布,用于描述不同症状对证侯的重要性,其中,S为医案集包含的症状总数;为证候k∈[1,…,K]上H维的证候-药物多项式分布,用于描述不同药物治疗一种证侯的重要性,其中,H为医案集包含的药物总数;对于某种证候下的所有词,假设和相互独立;θp为医案p上K维的医案-证候多项式分布;x为二元变量值,取值范围为{symptom,herb},以此来表达所生成词的2种不同类型,若x=symptom,则表示所生成词为症状,否则为药物;α、β、γ分别为Dirichlet先验分布的超参数;基于症状-证候-药物主题模型SSHTM的生成过程如下所示:
对于每个主题k∈[1,…,K],服从参数为β的狄利克雷先验分布,服从参数为γ的狄利克雷先验分布:
对于每例医案p∈P,θp服从参数为α的狄利克雷先验分布:θp~Dirichlet(α);
对于包含于每例医案p中的每个词,主题zpmn服从参数为θp的多项式分布:zpmn~Multi(θp);
若x=symptom,则症状spm服从参数为的多项式分布:若x=herb,则药物hpn服从参数为的多项式分布:
所述基于症状-证候-药物的主题模型构建及训练模块还包括参数学习单元,参数学习单元用于根据模型生成单元构建的模型,并对模型进行训练;其中训练过程中的参数θpk、及的计算分别如下:
其中,θpk表示医案p包含证候k的概率,表示证候k包含症状s的概率,表示证候k包含药物h的概率;表示医案p的症状分配给主题k的次数,表示医案p的药物分配给主题k的次数,表示在医案集中症状m分配给主题k的次数,表示在医案集中药物n分配给主题k的次数;
所述中医组方推荐模块包括构建症状-药物矩阵单元和排序推荐单元,其中,构建症状-药物矩阵单元包括:
构建症状-药物矩阵,其第i行j列的元素表示为p(hj|si),即治疗症状si的药物包含hj的概率,其计算如下所示:
其中,z为基于症状-证候-药物的主题模型中的证候主题,K为主题数,p(hj|z)即为SSHTM模型中的参数p(z|si)表示症状si包含于证候z的概率:
其中,p(si|z)为SSHTM模型中的参数p(si)表示症状si在医案集M中的出现频率,p(z)为主题z的先验概率,将其看作为一个常数;
排序推荐单元包括:
基于输入的患者症状及其对应权重,计算所有症状下每种药物的排序值Rank,其计算如下所示:
其中,weight(si)表示症状si的权重,若输入症状包含si,则为1,否则为0;
对所有药物的Rank值进行降序排列,并选择前N个药物作为其推荐药物,并将这N个药物的组合作为治疗患者症状的推荐处方,记为:pres.={H(N)}。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010279991.7/1.html,转载请声明来源钻瓜专利网。





