[发明专利]一种基于Apriori的图书推荐方法在审
| 申请号: | 201810876767.9 | 申请日: | 2018-08-03 |
| 公开(公告)号: | CN109344320A | 公开(公告)日: | 2019-02-15 |
| 发明(设计)人: | 宋耀莲;田榆杰;龙华;王慧东;徐文林;武双新 | 申请(专利权)人: | 昆明理工大学 |
| 主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/2458;G06N5/02 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 650093 云*** | 国省代码: | 云南;53 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 读者借阅 关联规则 频繁项集 图书推荐 置信度 数据挖掘 图书记录 高效性 排序 数据库 关联 查找 引入 | ||
1.一种基于Apriori的图书推荐方法,其特征在于:
Step1、建立读者借阅图书记录的数据库,读者信息作为标识符TID,所借阅的图书列表作为一个事务T,所有事务的集合为事务集D;
Step2、引入Apriori算法,每本图书作为一个候选1项集c1,所有c1的集合为C1,设置一个最小支持度阈值min_sup,当c1的支持度计数support_count(c1)大于等于min_sup时,则c1成为频繁1项集l1,所有l1的集合为L1,通过将L1与自身相连接产生候选2项集c2,所有c2的集合为C2,如果C2中第i个候选2项集c2(i)的某个子集为第x个候选1项集c1(x),且它不是L1的元素时,则将c2(i)从C2中删除;满足min_sup的c2作为频繁2项集l2,其集合为L2;依次循环类推,得到不同频繁项集l2、l3、……lk-1、lk的集合L2、L3……Lk-1、Lk,其中lk-1、lk分别代表频繁k-1项集和频繁k项集,Lk-1、Lk则为它们各自的集合;
Step3、设置一个最小置信度阈值min_conf;每个频繁项集l所产生的每个非空子集为s,若子集(l-s)与s的支持度计数之比大于等于最小置信度阈值min_conf,则输出强关联规则该强规则的置信度大小为l与s的支持度计数之比的值
Step4、将所计算出来的所有强关联规则按照其置信度confidence的大小进行排序,当输入一本图书时,通过关联规则得出与该图书相关联的其他图书。
2.根据权利要求1所述的基于Apriori的图书推荐方法,其特征在于:所述步骤Step1中,图书借阅记录数据库具有所有图书借阅记录数据信息,数据字段包括读者名字段与所借阅的图书名字段。
3.根据权利要求1所述的基于Apriori的图书推荐方法,其特征在于:所述步骤Step2中,为得到频繁k项集的集合Lk,通过将频繁k-1项集的集合Lk-1与自身相连接产生候选k项集的集合Ck。
4.根据权利要求1所述的基于Apriori的图书推荐方法,其特征在于:所述步骤Step3的关联规则置信度大小的计算公式如公式(1)所示:
其中:
式(1)和(2)中,min_conf为最小置信度阈值;l为频繁项集,l所产生的每个非空子集为s;support_count(l)、support_count(s)、support_count(l-s)分别为括号内字母的支持度计数,为强关联规则。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810876767.9/1.html,转载请声明来源钻瓜专利网。





