[发明专利]一种基于关系数据库从大数据下检索相同主从关系数据的算法在审
| 申请号: | 201510810811.2 | 申请日: | 2015-11-23 |
| 公开(公告)号: | CN105447137A | 公开(公告)日: | 2016-03-30 |
| 发明(设计)人: | 马亚飞;刘天智 | 申请(专利权)人: | 浪潮软件股份有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q10/06 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 250101 山东*** | 国省代码: | 山东;37 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 关系 数据库 数据 检索 相同 主从 算法 | ||
技术领域
本发明涉及基于关系数据库,具体涉及一种基于关系数据库从大数据下检索相同主从关系数据的算法。
背景技术
进入大数据时代,以数据驱动发展,从而提高企业决策能力和公共服务质量成为企业趋势。在针对海量数据的分析中,数据类型包括结构化数据、非结构化数据、半结构化数据,其中结构化数据又包括了简单结构数据与复杂结构数据。针对简单的结构数据,比如字符型、数字型数据可以通过数据库SQL直接进行统计分析,例如可以利用GROUPBY语句进行分组查询,从而找出完全相同的数据;也可以采用程序中对数据的循环进行比较,从而找出完全的数据。在海量数据的情况下,这种简单类型的数据对比通过优化数据库、优化算法即可以显著提高计算性能。但是对于主从关系数据的分析比对,则缺乏高效便捷的检索方法。
发明内容
本发明的技术任务是针对现有技术的不足,提供一种基于关系数据库从大数据下检索相同主从关系数据的算法。针对企业数据中海量主从结构数据,提供一种快速检索出相同记录的方法,从而为企业的管控分析提供数据支撑。
本发明解决其技术问题所采用的技术方案是:
一种基于关系数据库从大数据下检索相同主从关系数据的算法,是海量数据中进行数据比对的一种算法,采用“大而化小,先面后点”,利用分组遍历、中间表存储等算法逐步缩小数据比对范围,高效检索出相同的记录。
通过提取主从表分组依据-确定分组顺序-执行分组,在执行分组过程中结合遍历算法以及中间表存储逐步缩小数据范围的算法。
本发明的一种基于关系数据库从大数据下检索相同主从关系数据的算法与现有技术相比,所产生的有益效果是:本发明针对企业数据中海量主从结构数据,快速检索出相同记录的方法适用于企业管控中的需要检索相同主从结构数据的各种情形。相同订单数据的检索,可应用于企业窜货管理。企业窜货会扰乱企业产品的市场秩序,造成市场倾轧、价格混乱,严重影响厂商声誉。针对企业窜货的管控分析,要通过对订单的分析进行体现,其中一种分析方式就是从海量订单中找出相同的订单,然后通过对相同订单的判断找出是否有人为恶意刷单、虚假订单、内部人员串通倒货等导致窜货的情况。最终,增强企业的管控能力,为企业营造更好的市场环境,提高企业竞争力。
附图说明
图1为本算法步骤图。
图2为主从关系数据示例,订单数据的数据关系图。
图3为示例中检索相同订单的算法步骤图。
具体实施方式
下面对本发明的一种基于关系数据库从大数据下检索相同主从关系数据的算法作以下详细地说明。
一种基于关系数据库从大数据下检索相同主从关系数据的算法,采用“大而化小,先面后点”,利用分组遍历、中间表存储等算法逐步缩小数据比对范围,高效检索出相同的记录。
通过提取主从表分组依据-确定分组顺序-执行分组,在执行分组过程中结合遍历算法以及中间表存储逐步缩小数据范围的算法。
1)具体步骤如图1:
为了方便阐述,以企业常见主从关系数据-订单数据作为示例,假设主表数据表名为:CO_MAIN,从表数据表名为:CO_SUB。E-R关系图如图2:
目的:从海量订单数据中找出相同订单,即:订单商品与商品的数量完全相同的订单。
算法步骤如图3
1:确认分组指标为:
主表指标:订单总额、订单总量。
从表指标:订单商品种类数量、订单商品数量、订单商品金额。
最后分组依据:1)订单总额+订单总量
2)订单总额+订单总量+订单商品种类数量
3)订单商品数量+订单商品金额
2:确认分组执行顺序:
1)订单总额+订单总量
2)订单总额+订单总量+订单商品种类数量
3)订单商品数量+订单商品金额
3:按照分组顺序逐级执行分组比对
a:订单总额+订单总量分组;订单总额+订单总量+订单商品种类数量分组
利用两层嵌套GROUPBY分组找到,订单总金额、订单总量、订单上商品种类的数量相同的订单,存放到maysamelist中。
其中CO_COUNT表示分组中订单的数量,CO_COUNT_NUM1表示分组中的顺序。
b:订单商品数量+订单商品金额分组
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮软件股份有限公司,未经浪潮软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510810811.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种存取具有地理范围之讯息的方法
- 下一篇:一种数学运算系统
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





