[发明专利]提取具有意义的频出项目集的系统、方法以及程序有效
申请号: | 201110216914.8 | 申请日: | 2011-07-29 |
公开(公告)号: | CN102456068A | 公开(公告)日: | 2012-05-16 |
发明(设计)人: | 吉田一星 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京市中咨律师事务所 11247 | 代理人: | 于静;杨晓光 |
地址: | 美国*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 提取 具有 意义 项目 系统 方法 以及 程序 | ||
1.一种方法,通过计算机的计算处理,从存储分别包含具有一个或多个项目的项目集的多个记录的数据库中提取具有意义的频出项目集,所述数据库内的多个项目具有项目的顺序,所述方法包括:
(a)决定步骤,所述计算机在与前一个被设为研究对象的项目集即旧项目集内顺序最晚的项目相比顺序靠后的项目存在一个以上的情况下,将所述一个以上的顺序靠后的项目按降序向所述旧项目集加上一个,决定新设为研究对象的项目集即新项目集,所述旧项目集的初始值中顺序为最初的空项目φ;
(b)登记步骤,所述计算机以所述新项目集的出现频度为预定阈值以上为条件,将所述新项目集的所述出现频度登记于所述计算机的存储器上准备的表;
(c)判定步骤,所述计算机对向所述表的登记进行应答,使用所述表内的值判定所述新项目集内的各项目与从所述新项目集除去该项目后剩下的项目的子集之间是否具有相关关系;
(d)登记步骤,所述计算机对于所述新项目集内的所有项目的各个,以所述判定结果是肯定为条件,将所述新项目集登记于所述具有意义的频出项目集的集合;以及
(e)重复步骤,所述计算机对向所述具有意义的频出项目的集合的登记进行应答,将所述新项目集作为所述旧项目集基于原来的所述旧项目集决定新项目集之前,重复(a)的步骤。
2.根据权利要求1所述的方法,还包括如下步骤:在构成包含顺序为第二个的项目的所述新项目集的项目的顺序不连续的情况下,在步骤(c)之后,所述计算机将关于从所述新项目集除去在不连续的项目中顺序最早的项目后的项目集以及从所述新项目集除去所述顺序为第二个的项目后的项目集的各自的出现频度从所述表删除。
3.根据权利要求2所述的方法,其中,步骤(c)中的相关的判定,在将所述记录数设为|T|,将新项目集Y的出现频度设为|T(Y)|,将关于新项目集Y内的任意项目y的出现频度设为|T({y})|,将从新项目集Y除去该y后剩下的项目的子集的出现频度设为|T(Y-{y})|,将α设为比1大的预定的阈值的情况下,通过判定式|T|×|T(Y)|≥α×|T(Y-{y})|×|T({y})|是否成立进行。
4.根据权利要求2所述的方法,其中,所述表具有用于将构成项目集的项目的id的列表作为关键字检索该项目集的出现频度的映射构造。
5.根据权利要求4所述的方法,其中,所述项目的顺序是从赋予各项目的1起开始的连续的正整数的id的顺序。
6.一种程序,通过计算机的处理,从存储分别包含具有一个或多个项目的项目集的多个记录的数据库中提取具有意义的频出项目集,所述数据库内的多个项目具有项目的顺序,所述程序使计算机执行如下步骤:
(a)决定步骤,在与前一个被设为研究对象的项目集即旧项目集内顺序最晚的项目相比顺序靠后的项目存在一个以上的情况下,将所述一个以上的顺序靠后的项目按降序向所述旧项目集加上一个,决定新设为研究对象的项目集即新项目集,所述旧项目集的初始值中顺序为最初的空项目φ;
(b)登记步骤,以所述新项目集的出现频度为预定阈值以上为条件,将所述新项目集的所述出现频度登记于表;
(c)判定步骤,对向所述表的登记进行应答,使用所述表内的值判定所述新项目集内的各项目与从所述新项目集除去该项目后剩下的项目的子集之间是否具有相关关系;
(d)登记步骤,对于所述新项目集内的所有项目的各个,以所述判定结果是肯定为条件,将所述新项目集登记于所述具有意义的频出项目集的集合;以及
(e)重复步骤,对向所述具有意义的频出项目的集合的登记进行应答,将所述新项目集作为所述旧项目集基于原来的所述旧项目集决定新项目集之前,重复(a)的步骤。
7.根据权利要求6所述的方法,还使计算机执行如下步骤:在构成包含顺序为第二个的项目的所述新项目集的项目的顺序不连续的情况下,在步骤(c)之后,将关于从所述新项目集除去在不连续的项目中顺序最早的项目后的项目集以及从所述新项目集除去所述顺序为第二个的项目后的项目集的各自的出现频度从所述表删除。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110216914.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:在现有静止图像内可视化视频
- 下一篇:红外感应医疗专用智能无接触污物车