[发明专利]一种基于多视图主题建模技术的异常处方筛选方法有效
申请号: | 201810992868.2 | 申请日: | 2018-08-29 |
公开(公告)号: | CN109448808B | 公开(公告)日: | 2022-05-03 |
发明(设计)人: | 赵俊峰;詹思延;谢冰;卓琳;唐爽;刘少钦 | 申请(专利权)人: | 北京大学 |
主分类号: | G16H20/10 | 分类号: | G16H20/10;G16H70/40;G06F16/335;G06K9/62 |
代理公司: | 北京君尚知识产权代理有限公司 11200 | 代理人: | 司立彬 |
地址: | 100871 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 视图 主题 建模 技术 异常 处方 筛选 方法 | ||
1.一种基于多视图主题建模技术的异常处方筛选方法,其步骤为:
1)将医疗数据整理成处方数据,其中每条处方数据中包含处方中的诊断特征和用药特征;
2)将所述处方数据输入MV-LDA模型中,对所述MV-LDA模型进行训练;其中,MV-LDA模型包括K个主题,每个主题中包含诊断特征视图和用药特征视图;主题k中的诊断特征视图由一个诊断特征集合和集合中每个诊断特征的所对应的概率值组成,相应的,用药特征视图由一个用药特征集合和集合中每个用药特征所对应的概率值组成;
3)对于一待识别处方数据,利用训练好的MV-LDA模型对该待识别处方数据进行推断,得到该待识别处方数据的基于诊断特征的主题分布和基于用药特征的主题分布;然后计算两主题分布的相似度,如果相似度低于设定阈值,则判断该待识别处方数据是异常处方。
2.如权利要求1所述的方法,其特征在于,使用吉布斯采样进行MV-LDA模型的求解,计算MV-LDA模型中的参数,得到训练好的MV-LDA模型。
3.如权利要求2所述的方法,其特征在于,使用吉布斯采样进行MV-LDA模型求解的方法为:对于处方数据m,对该处方数据m中的A类特征进行抽样,为A类特征中的特征xa分配主题k的概率为:其中,C表示矩阵,VA是A类特征类别数量,xA为A类特征对应的主题个数,代表训练数据集所有处方数据中xa分配给主题k的计数,K表示主题的个数,k表示K个主题中的第k个主题;代表所有分配给主题k的任意A类特征的计数,βA是Dirichlet先验;z为给特征xa分配的主题,z-i表示给其余特征分配的主题,表示处方数据m中的所有特征中分配了主题k的数目,表示处方数据m中的所有特征的数目,M为训练数据集中处方数据的总数,α是Dirichlet先验;A类特征为诊断特征或用药特征;然后根据给xa所分配的主题k得到MV-LDA模型中的参数取值。
4.如权利要求3所述的方法,其特征在于,A类特征的主题特征分布为其中,表示A类特征的主题特征分布在主题为k、特征为x的情况下的取值。
5.如权利要求1所述的方法,其特征在于,采用KL散度、欧几里得距离、余弦相似度、皮尔逊相关性或向量点乘方法计算所述相似度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810992868.2/1.html,转载请声明来源钻瓜专利网。