[发明专利]一种基于关联规则的文本推荐方法有效

专利信息
申请号: 202110400230.7 申请日: 2021-04-14
公开(公告)号: CN112989026B 公开(公告)日: 2023-08-01
发明(设计)人: 高英;李泰稷;陈吉祥 申请(专利权)人: 华南理工大学
主分类号: G06F16/335 分类号: G06F16/335;G06F16/33;G06F16/31
代理公司: 重庆飞思明珠专利代理事务所(普通合伙) 50228 代理人: 李宁
地址: 510000*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 关联 规则 文本 推荐 方法
【说明书】:

一种基于关联规则的文本推荐方法,具体步骤为:步骤一:从数据集中选择词项集构建FP树,并利用FP树挖掘关联规则构建关联规则库;步骤二:当获取用户输入时,输入文本经过分词处理生成词项集,词项集与已有的关联规则进行匹配;步骤三:匹配后有相同后继的关联规则进行加权求和得到所有规则后继及其权重,存在于同一目标文本的规则后继求和得到所有目标文本及其权重;步骤四:输出预测结果。本发明具有准确率高、计算速度快、适应性强、可扩展性等特点。

技术领域

本发明涉及数据挖掘技术领域,具体涉及一种基于关联规则的文本推荐方法。

背景技术

目前,面向用户的推荐算法有以下分类,即基于内容的方法,基于协同的方法,基于效用的方法,基于知识的方法,基于关联规则的方法。在基于内容的方法中,项目或对象是通过相关特征的属性来定义的,系统基于用户评价对象的特征、学习用户的兴趣,考察用户资料与待预测项目的匹配程度。但是复杂属性不好处理,并且要有足够数据构造分类器。

基于协同过滤的方法一般采用最近邻技术,利用用户的历史喜好信息计算用户之间的距离,然后利用目标用户的最近邻居用户对商品评价的加权评价值来预测目标用户对特定商品的喜好程度,但是无法解决稀疏问题和可扩展性问题。基于效用的方法是建立在对用户使用项目的效用情况上计算的,其核心问题是怎样为每一个用户去创建一个效用函数,用户资料模型很大程度上是由系统所采用的效用函数决定的,因此用户必须输入效用函数,而且推荐是静态的,灵活性差。

基于知识的方法因它们所用的功能知识不同而有明显区别,在某种程度上可以看成是一种推理技术,它不是建立在用户需要和偏好基础上推荐的。因此推理所需的知识较难获得,而且推荐是静态的。

虽然基于关联规则的方法在商品销售中已经得到了成功的应用,但是算法的第一步关联规则的发现最为关键且最耗时,是算法的瓶颈。其次,文字的同义性问题也是关联规则的一个难点。

发明内容

本发明针对现有技术的不足,提出一种具有准确率高、计算速度快、适应性强、可扩展性等特点的基于关联规则的文本推荐方法,具体技术方案如下:

步骤一:从数据集中选择词项集构建FP树,并利用FP树挖掘关联规则构建关联规则库;

步骤二:当获取用户输入时,输入文本经过分词处理生成词项集,词项集与已有的关联规则进行匹配;

步骤三:匹配后有相同后继的关联规则进行加权求和得到所有规则后继及其权重,存在于同一目标文本的规则后继求和得到所有目标文本及其权重;

步骤四:输出预测结果。

作为优化:所述步骤一中FP树即频繁模式树,由频繁项头表和项前缀树构成,项头表用于存储数据库中所有前件项及其支持度,该项在所有事务中出现的次数,表中的项按照支持度大小降序排序,项头表还包含每个项在前缀树中结点链表的表头指针,用于快速访问前缀树中所有包含相同项的结点,数据库的事务由推理规则的前件和后件,即词项集及其所对应的目标文本组成,增加了叶结点,表示该路径所有条件模式基所对应的推理后件;

在构建FP树时,首先扫描原始数据库并建立项头表;然后再次扫描数据库,将每个事务中前件的项按照支持度降序排序并添加到前缀树中,每个事务都将作为前缀树中的一条路径,其中中间结点为该事务前件的项,叶结点为后件;每个结点的支持度表示该路径上同一位置相同结点重复出现的次数,数据库二次扫描完毕时FP树构建完成。

作为优化:所述步骤一中FP树挖掘关联规则具体为,首先要从项头表的底部项依次向上挖掘,对于项头表对应于FP树的每一项都要找到它的条件模式基,条件模式基是以需要挖掘的结点作为叶子结点所对应的FP子树。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110400230.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top