[发明专利]数据处理方法及装置在审
申请号: | 202111649814.4 | 申请日: | 2021-12-29 |
公开(公告)号: | CN114328491A | 公开(公告)日: | 2022-04-12 |
发明(设计)人: | 裴冉;李福海;狄程;杨喆炜 | 申请(专利权)人: | 中国工商银行股份有限公司 |
主分类号: | G06F16/215 | 分类号: | G06F16/215;G06F16/22;G06F16/28;G06K9/62 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 黄海英 |
地址: | 100140 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 装置 | ||
本申请公开了一种数据处理方法及装置。涉及金融科技领域,该方法包括:通过增长算法对目标数据进行处理,得到目标数据对应的频繁模式树,其中,频繁模式树包括多个代表数据项的节点,以及具有关联关系的数据项的节点之间连线;根据项合并策略对频繁模式树进行合并处理,得到合并后的频繁模式树;对合并后的频繁模式树进行迭代处理,得到迭代后的频繁模式树,其中,迭代后的频繁模式树中所包括的每个数据项对应一种虚拟物品。通过本申请,解决了相关技术中无人销售数据,需要进行分析和分类,存在效率低准确性低的问题。
技术领域
本申请涉及金融科技领域,具体而言,涉及一种数据处理方法及装置。
背景技术
信息技术高度发达,在大数据的时代背景下,企业获取数据的效率日益提高,数据的规模和种类庞大,在庞大的数据量背后,蕴含了大量有利于企业经营的有效信息。对这些数据进行整理、分析后,能够保证企业在具有有效数据支持下获得更高的经济效益和有效的管理决策。数据挖掘已成为了大数据时代下零售业销售分析的关键。
目前的销售行业模式逐渐趋向于多样化,与传统的销售线下店不同,无人商店便是一种新兴的销售线下店模式。
无人商店因为没有店员存在,导致物品缺货时无法快速补货,并且因空间有限,无法存储大量货物,故需要根据数据对销量进行预测以及对库存进行调整。通过数据挖掘及分析,可以从海量原始数据中提取出尽可能多、尽可能准确的相关信息,为无人商店销售业务提供有力的数据支撑。导致无人销售数据,需要进行分析和分类,存在效率低准确性低。
针对相关技术中无人销售数据,需要进行分析和分类,存在效率低准确性低的问题,目前尚未提出有效的解决方案。
发明内容
本申请的主要目的在于提供一种数据处理方法及装置,以解决相关技术中无人销售数据,需要进行分析和分类,存在效率低准确性低的问题。
为了实现上述目的,根据本申请的一个方面,提供了一种数据处理方法,包括:通过增长算法对目标数据进行处理,得到所述目标数据对应的频繁模式树,其中,所述频繁模式树包括多个代表数据项的节点,以及具有关联关系的数据项的节点之间连线;根据项合并策略对所述频繁模式树进行合并处理,得到合并后的频繁模式树;对所述合并后的频繁模式树进行迭代处理,得到迭代后的频繁模式树,其中,所述迭代后的频繁模式树中所包括的每个数据项对应一种虚拟物品。
可选的,通过增长算法对目标数据进行处理,得到所述目标数据对应的频繁模式树包括:扫描用于存储所述目标数据的数据库,获取多个不同事务的数据项的项集,以及每个数据项的频数;按照所述频数降序生成频繁项目列表;再次扫描所述数据库,提取各个事务的数据项;根据所述频繁项目列表的先后顺序,将各个事务的数据项逐项插入,生成所述频繁模式树。
可选的,通过增长算法对目标数据进行处理,得到所述目标数据对应的频繁模式树之前,所述方法还包括:对所述数据库中的所述目标数据进行清洗;对清洗后的目标数据进行审查与校验,其中,所述审查与校验包括下列至少之一:填补空缺信息,删除重复信息,纠正错误信息,调整数据结构;对校验后的目标数据进行有效性分析,将无效的数据删除。
可选的,根据所述频繁项目列表的先后顺序,将数据项逐项插入,生成所述频繁模式树包括:创建初始频繁模式树,所述初始频繁模式树的根节点;根据所述频繁项目列表的先后顺序,将每个事务的数据项逐项创建节点进行连接,并记录所述数据项的频数;为不同的事务创建不同的分枝,在创建分支的事务与已有分枝的数据项相同的情况下,将相同的数据项合并,生成所述频繁模式树。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111649814.4/2.html,转载请声明来源钻瓜专利网。