[发明专利]基于审计数据的数据库表分类方法及系统在审
申请号: | 202211134642.1 | 申请日: | 2022-09-19 |
公开(公告)号: | CN115510228A | 公开(公告)日: | 2022-12-23 |
发明(设计)人: | 刘思远 | 申请(专利权)人: | 浪潮软件集团有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/33;G06F40/216;G06K9/62 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 孙园园 |
地址: | 250100 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 审计 数据 数据库 分类 方法 系统 | ||
本发明公开了基于审计数据的数据库表分类方法及系统,属于数据库表处理技术领域,本发明要解决的技术问题为如何基于用户对数据库的使用方式及对应的数据进行分类,确保能够更好的组织符合用户使用习惯的数据存储位置,从而提升读写效率及读写,采用的技术方案为:该方法具体如下:获取统计数据:统计数据包括统计表的读取数据、统计写入数据以及统计整个数据库大小;获取分类图表:通过统计数据计算数据库表的读写特性,进而完成分类图表;划分类别:根据用户的类别需求及分类图表,将数据库表划分为用户需求的类别;优化存储:根据数据库表的类别,优化数据库表的存储结构,提升读写性能,进而适应对应的审计策略。
技术领域
本发明涉及数据库表处理技术领域,具体地说是一种基于审计数据的数据库表分类方法及系统。
背景技术
审计子系统作为安全操作系统的一个重要组成部分,对于监督系统的正常运行、保障安全策略的正确实施、构造计算机入侵检测系统等都具有十分重要的意义。
数据库审计系统实现了所有访问数据库操作行为的审计,是一款基于数据库协议标准分析和SQL解析技术的数据库审计产品。数据库审计系统能够详细记录用户对数据库进行增删改查、查询、登录等操作行为及返回结果,通过配置安全规则实现对危险操作的实时告警和事后追溯,从而达到保护数据库安全的防护效果。内部人员、运维人员、DBA、开发人员对数据库中的数据都需要频繁地访问;诸多的人群和过高的权限造成敏感数据集中泄露的风险。
TF-IDF(term frequency–inverse document frequency)是一种用于信息检索与数据挖掘的常用加权技术。其中,TF是词频(Term Frequency),IDF是逆文本频率指数(Inverse Document Frequency)。
TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。TF-IDF加权的各种形式常被搜索引擎应用,作为文件与用户查询之间相关程度的度量或评级。除了TF-IDF以外,因特网上的搜索引擎还会使用基于链接分析的评级方法,以确定文件在搜寻结果中出现的顺序。
数据操纵语言(Data Manipulation Language,DML)是用于数据库操作,对数据库其中的对象和数据运行访问工作的编程语句,通常是数据库专用编程语言之中的一个子集,例如在信息软件产业通行标准的SQL语言中,以INSERT、UPDATE、DELETE三种指令为核心,分别代表插入(意指新增或创建)、更新(修改)与删除(销毁)。在使用数据库的系统开发过程中,其中应用程序必然会使用的指令;而加上SQL的SELECT语句,欧美地区的开发人员把这四种指令,以“CRUD”(分别为Create,Read,Update,Delete英文四前缀字母缩略的术语)来称呼;或可能以四个汉字:增查改删来略称。
余弦相似度(cosine similarity),又称为余弦相似性。通过计算两个向量的夹角余弦值来评估他们的相似度。如果两个向量的方向一致,即夹角接近零,那么这两个向量就相近。
要确定两个向量方向是否一致,可以用余弦定理计算向量的夹角。夹角越小,余弦值越接近于1,它们的方向更加吻合,则越相似。最常见的应用就是计算文本相似度。将两个文本根据他们词,建立俩个向量,计算这两个向量的余弦值,就可以知道两个文本的相似度情况
TF-IDF采用文本逆频率IDF对TF值加权取权值大的作为关键词,但IDF的简单结构并不能有效地反映单词的重要程度和特征词的分布情况,使其无法很好地完成对权值调整的功能,所以TF-IDF算法的精度并不是很高,尤其是当文本集已经分类的情况下。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮软件集团有限公司,未经浪潮软件集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211134642.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于AI的自动化测试平台及方法
- 下一篇:机柜扫描处理方法及系统
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置