[发明专利]一种基于隐语义模型的中医组方推荐方法及系统有效

专利信息
申请号: 202010279991.7 申请日: 2020-04-10
公开(公告)号: CN111477295B 公开(公告)日: 2022-06-03
发明(设计)人: 李巧勤;巩小强;刘勇国;杨尚明 申请(专利权)人: 电子科技大学
主分类号: G16H20/10 分类号: G16H20/10;G16H20/90;G16H50/70;G06F40/30;G06F16/335;G06F16/31
代理公司: 成都行之专利代理事务所(普通合伙) 51220 代理人: 李朝虎
地址: 610000 四川省成*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 隐语 模型 中医 推荐 方法 系统
【权利要求书】:

1.一种基于隐语义模型的中医组方推荐方法,其特征在于,该方法包括以下步骤:

S0:采集某种疾病的多例医案信息,医案信息包括医案数及每例医案对应症状和药物;

S1:根据步骤S0采集的信息,基于对医案库中症状和对应处方的隐语义分析,提取出隐含证候,发现隐含证候、症状和药物间存在的关系,建立基于症状-证候-药物的主题模型,并进行参数学习训练;

S2:输入待检测的用户症状,从基于症状-证候-药物的主题模型结果中获取的症状、证候、药物之间的对应关系,进行相应处方推荐,并输出推荐结果,为医生诊疗过程的组方提供参考和辅助决策;

所述步骤S1具体包括基于症状-证候-药物的主题模型的生成;

假设一例医案被视为一篇文档,一种证候被视为一个主题;令|P|为临床医案数,每例医案p包含种症状和种药物,hpn为医案p中的第n种药物,spm为医案p中的第m种症状,zpmn为词hpn和spm的潜在证候分布;K为证候主题数,每个主题k∈[1,…,K]表示一种证候;为证候k∈[1,…,K]上S维的证候-症状多项式分布,用于描述不同症状对证侯的重要性,其中,S为医案集包含的症状总数;为证候k∈[1,…,K]上H维的证候-药物多项式分布,用于描述不同药物治疗一种证侯的重要性,其中,H为医案集包含的药物总数;对于某种证候下的所有词,假设和相互独立;θp为医案p上K维的医案-证候多项式分布;x为二元变量值,取值范围为{symptom,herb},以此来表达所生成词的2种不同类型,若x=symptom,则表示所生成词为症状,否则为药物;α、β、γ分别为Dirichlet先验分布的超参数;基于症状-证候-药物主题模型SSHTM的生成过程如下所示:

步骤1:对于每个主题k∈[1,…,K],服从参数为β的狄利克雷先验分布,服从参数为γ的狄利克雷先验分布:

步骤2:对于每例医案p∈P,θp服从参数为α的狄利克雷先验分布:θp~Dirichlet(α);

步骤3:对于包含于每例医案p中的每个词,主题zpmn服从参数为θp的多项式分布:zpmn~Multi(θp);

步骤4:若x=symptom,则症状spm服从参数为的多项式分布:若x=herb,则药物hpn服从参数为的多项式分布:

所述步骤S1还包括基于症状-证候-药物的主题模型的参数学习训练;

其中,参数θpk、及的计算分别如下:

其中,θpk表示医案p包含证候k的概率,表示证候k包含症状s的概率,表示证候k包含药物h的概率;表示医案p的症状分配给主题k的次数,表示医案p的药物分配给主题k的次数,表示在医案集中症状m分配给主题k的次数,表示在医案集中药物n分配给主题k的次数;

所述步骤S2中对输入的待检测用户的症状,进行预处理,将其表示为一个n维向量,n为包含于医案集的症状数;其中,每种症状用0、1编码表示,若输入症状存在,则编码为1,否则为0;

所述步骤S2具体包括如下子步骤:

S21:构建症状-药物矩阵,获取症状与药物之间的对应关系;

构建症状-药物矩阵,其第i行j列的元素表示为p(hj|si),即治疗症状si的药物包含hj的概率,其计算如下所示:

其中,z为基于症状-证候-药物的主题模型中的证候主题,K为主题数,p(hj|z)即为SSHTM模型中的参数p(z|si)表示症状si包含于证候z的概率:

其中,p(si|z)为SSHTM模型中的参数p(si)表示症状si在医案集M中的出现频率,p(z)为主题z的先验概率,将其看作为一个常数;

S22:对所有症状计算每种药物的排序值Rank,并选择具有较大排序值的药物作为其推荐药物,并将这些推荐药物的组合作为治疗患者的推荐处方;

S221:基于输入的患者症状及其对应权重,计算所有症状下每种药物的排序值Rank,其计算如下所示:

其中,weight(si)表示症状si的权重,若输入症状包含si,则为1,否则为0;

S222:对所有药物的Rank值进行降序排列,并选择前N个药物作为其推荐药物,并将这N个药物的组合作为治疗患者症状的推荐处方,记为:pres.={H(N)}。

2.一种基于隐语义模型的中医组方推荐系统,其特征在于,该系统支持上述权利要求1所述的一种基于隐语义模型的中医组方推荐方法,包括:

医案信息采集模块:用于采集某种疾病的多例医案信息,医案信息包括医案数及每例医案对应症状和药物;

基于症状-证候-药物的主题模型构建及训练模块:连接医案信息采集模块,基于对医案中症状和对应处方的隐语义分析,提取出隐含证候,发现隐含证候、症状和药物间存在的关系,建立基于症状-证候-药物的主题模型,并进行模型训练及保存;

用户信息输入模块:用于获取待检测用户的症状,并进行预处理相关解析;

中医组方推荐模块:分别连接用户信息输入模块和基于症状-证候-药物的主题模型构建及训练模块,用于根据输入待检测用户的症状,从基于症状-证候-药物的主题模型结果中获取的症状、证候、药物之间的对应关系,进行相应处方推荐,并输出推荐结果,为医生诊疗过程的组方提供参考和辅助决策;

所述基于症状-证候-药物的主题模型构建及训练模块包括模型生成单元,模型生成单元包括:

假设一例医案被视为一篇文档,一种证候被视为一个主题;令|P|为临床医案数,每例医案p包含种症状和种药物,hpn为医案p中的第n种药物,spm为医案p中的第m种症状,zpmn为词hpn和spm的潜在证候分布;K为证候主题数,每个主题k∈[1,…,K]表示一种证候;为证候k∈[1,…,K]上S维的证候-症状多项式分布,用于描述不同症状对证侯的重要性,其中,S为医案集包含的症状总数;为证候k∈[1,…,K]上H维的证候-药物多项式分布,用于描述不同药物治疗一种证侯的重要性,其中,H为医案集包含的药物总数;对于某种证候下的所有词,假设和相互独立;θp为医案p上K维的医案-证候多项式分布;x为二元变量值,取值范围为{symptom,herb},以此来表达所生成词的2种不同类型,若x=symptom,则表示所生成词为症状,否则为药物;α、β、γ分别为Dirichlet先验分布的超参数;基于症状-证候-药物主题模型SSHTM的生成过程如下所示:

对于每个主题k∈[1,…,K],服从参数为β的狄利克雷先验分布,服从参数为γ的狄利克雷先验分布:

对于每例医案p∈P,θp服从参数为α的狄利克雷先验分布:θp~Dirichlet(α);

对于包含于每例医案p中的每个词,主题zpmn服从参数为θp的多项式分布:zpmn~Multi(θp);

若x=symptom,则症状spm服从参数为的多项式分布:若x=herb,则药物hpn服从参数为的多项式分布:

所述基于症状-证候-药物的主题模型构建及训练模块还包括参数学习单元,参数学习单元用于根据模型生成单元构建的模型,并对模型进行训练;其中训练过程中的参数θpk、及的计算分别如下:

其中,θpk表示医案p包含证候k的概率,表示证候k包含症状s的概率,表示证候k包含药物h的概率;表示医案p的症状分配给主题k的次数,表示医案p的药物分配给主题k的次数,表示在医案集中症状m分配给主题k的次数,表示在医案集中药物n分配给主题k的次数;

所述中医组方推荐模块包括构建症状-药物矩阵单元和排序推荐单元,其中,构建症状-药物矩阵单元包括:

构建症状-药物矩阵,其第i行j列的元素表示为p(hj|si),即治疗症状si的药物包含hj的概率,其计算如下所示:

其中,z为基于症状-证候-药物的主题模型中的证候主题,K为主题数,p(hj|z)即为SSHTM模型中的参数p(z|si)表示症状si包含于证候z的概率:

其中,p(si|z)为SSHTM模型中的参数p(si)表示症状si在医案集M中的出现频率,p(z)为主题z的先验概率,将其看作为一个常数;

排序推荐单元包括:

基于输入的患者症状及其对应权重,计算所有症状下每种药物的排序值Rank,其计算如下所示:

其中,weight(si)表示症状si的权重,若输入症状包含si,则为1,否则为0;

对所有药物的Rank值进行降序排列,并选择前N个药物作为其推荐药物,并将这N个药物的组合作为治疗患者症状的推荐处方,记为:pres.={H(N)}。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010279991.7/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top