[发明专利]一种基于Apriori的病症数据关联方法在审

申请号：	201810227807.7	申请日：	2018-03-20
公开（公告）号：	CN108550401A	公开（公告）日：	2018-09-18
发明（设计）人：	宋耀莲;田榆杰;王慧东;徐文林;武双新	申请（专利权）人：	昆明理工大学
主分类号：	G16H70/40	分类号：	G16H70/40;G16H20/13;G16H50/70;G06F17/30;G06F17/27
代理公司：	暂无信息	代理人：	暂无信息
地址：	650093 云***	国省代码：	云南;53
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明涉及一种基于Apriori的病症数据关联方法，属于数据挖掘推荐技术领域。本发明先建立一个病症关键词的数据库；然后通过已建立的病症关键词数据库，用常规的分词程序对药品的适用症状文本进行分词处理，并提取出适用症状的关键词。每个关键词作为一个候选1项集，引入Apriori算法计算出不同项数的频繁项集；其次，由各频繁项集产生相应的强关联规则，并计算出各强关联规则的置信度大小；最后，通过各强关联规则的置信度大小，将这些频繁项集进行推荐排序。本发明与现有技术相比，主要提供了Apriori算法对病症的诊断编辑起到关联推荐作用，提高医生开处方时对症状编辑的准确性与高效性。
搜索关键词：	关联规则频繁项集病症数据置信度关联关键词数据库分词处理数据挖掘常规的高效性分词排序数据库处方文本诊断引入医生
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于Apriori的病症数据关联方法，其特征在于：包括如下步骤：Step1、建立病症关键词数据库；Step2、通过所建病症关键词数据库中的关键词对药品的适用症状文本进行分词处理，并提取出适用症状的病症关键词；Step3、引入Apriori算法，所有药品的集合为D，每个病症关键词作为候选1项集c1，第i个候选1项集记为c1(i)，其集合为C1，设置一个最小支持度阈值min_sup，当c1的支持度计数support_count(c1)大于等于min_sup时，则c1成为频繁1项集l1，所有l1的集合为L1，通过将L1与自身相连接产生候选2项集c2，所有c2的集合为C2，如果C2中第i个候选2项集c2(i)的某个子集为第x个候选1项集c1(x)，且它不是L1的元素时，则将c2(i)从C2中删除；满足min_sup的c2作为频繁2项集l2，其集合为L2；依次循环类推，得到不同频繁项集l2、l3、……lk‑1、lk的集合L2、L3……Lk‑1、Lk，其中lk‑1、lk分别代表频繁k‑1项集和频繁k项集，Lk‑1、Lk则为它们各自的集合；Step4、设置一个最小置信度阈值min_conf；每个频繁项集l所产生的每个非空子集为s，若子集(l‑s)与s的支持度计数之比大于等于最小置信度阈值min_conf，则输出强关联规则该强规则的置信度大小为l与s的支持度计数之比的值Step5、将所计算出来的所有强关联规则按照其置信度confidence的大小进行排序，当输入一个病症时，通过关联规则得出与该病症相关联的其他病症。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于昆明理工大学，未经昆明理工大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201810227807.7/，转载请声明来源钻瓜专利网。

上一篇：空气污染物对呼吸道疾病病患人数影响的评估方法
下一篇：一种基于网络医院的药店机器人自助问诊装置

同类专利

专利分类

G 物理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于Apriori的病症数据关联方法在审

专利文献下载