[发明专利]使用企业数据源预测文档中的策略违规在审
申请号: | 202211123115.0 | 申请日: | 2022-09-15 |
公开(公告)号: | CN116029544A | 公开(公告)日: | 2023-04-28 |
发明(设计)人: | J.约瑟夫;S.R.马鲁达纳亚甘;P.贝比;A.沙伊克 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06Q10/0635 | 分类号: | G06Q10/0635;G06Q10/107;G06F16/907;G06F18/23213 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 陈金林 |
地址: | 美国纽*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 使用 企业 数据源 预测 文档 中的 策略 违规 | ||
预测给定数据源(诸如文档集合)中的潜在策略违规,使得可以对文档集合执行更深入分析以获得对可能包含在其中的潜在策略违规的附加见解。在一些实例中,该预测是通过对文档集合执行随机采样操作并从这些文档收集元数据以便确定被随机采样的文档集合是否包括可以被补救的策略违规来完成的。
技术领域
本发明总体上涉及监管合规领域,并且更具体地,涉及使用企业相关的解决方案来确保大型企业遵守适用的法规。
背景技术
针对“元数据”的维基百科条目(截至2021年8月23日)陈述如下:“元数据是‘提供关于其他数据的信息的数据’。存在许多不同类型的元数据,包括描述性元数据、结构性元数据、管理性元数据、引用性元数据、统计性元数据和法律性元数据。”
维基百科针对“启发式(计算机科学)”的条目(截至2021年8月23日)陈述如下:“在……计算机科学中,启发式…是被设计用于在经典方法太慢时更快地解决问题的技术,或者在经典方法不能找到任何确切解时找到近似解的技术。这是通过用最优性、完整性、准确性或精度交换速度来实现的。在某种意义上,它可以被认为是快捷方式。启发式函数,也简称为启发式,是基于可用信息在每个分支步骤对搜索算法中的替代方案进行排名以决定跟随哪个分支的函数。”
发明内容
根据本发明的各方面,提供了一种执行以下操作(不一定按以下顺序)的方法、计算机程序产品和/或系统:(i)接收多个文档,该多个文档包括实质性内容数据和元数据;(ii)初始化多个随机桶以执行随机采样操作;(iii)从多个初始化的随机桶计算元数据样本大小,其中元数据样本大小是至少部分地基于预定置信度水平和误差率从其收集元数据的文档的数量;(iv)从多个文档收集元数据,直到所收集的元数据等于所计算的元数据样本大小;以及(v)响应于元数据的收集,分析多个文档的第一子集以确定多个文档的第一子集是否包括策略违规;(vi)确定数据源内的区域或(一个或多个)文档类型是否可能包含与数据源内的其他区域或(一个或多个)文档类型相比更多的策略违规。
根据本发明的各方面,提供了一种执行以下操作(不一定按以下顺序)的方法、计算机程序产品和/或系统:(i)接收多个文档,该多个文档包括实质性内容数据和元数据;(ii)接收元数据目录,其中该元数据目录包括指示多个文档的策略合规分数的信息;(iii)由元数据扫描模块运行该多个文档的元数据扫描;(iv)响应于运行元数据扫描,确定该多个文档的多个元数据分数;(v)将该多个文档的多个元数据分数与被包括在元数据目录中的该多个文档的策略合规分数进行比较;以及(vi)至少部分地基于该多个元数据分数与策略合规分数的比较来确定该多个文档中的任一个文档是否包括策略违规;(vii)通过仅查看元数据属性来预测文档是否具有潜在的策略违规。
附图说明
图1是根据本发明的系统的第一实施例的框图;
图2是示出至少部分地由该第一实施例系统执行的第一实施例方法的流程图;
图3是示出第一实施例系统的机器逻辑(例如,软件)部分的框图;
图4是示出有助于理解本发明的实施例的信息的图;以及
图5是示出有助于理解本发明的实施例的信息的第二图。
具体实施方式
本发明的一些实施例针对预测给定数据源(例如,文档集合)中的潜在策略违规,从而可以对文档集合执行更深入的分析以获得对可能包含在其中的(一个或多个)潜在策略违规的附加见解。在一些实例中,该预测是通过对该文档集合执行随机采样操作并从这些文档收集元数据以便确定被随机采样的该文档集合是否包括可以被补救的策略违规来完成的。
具体实施方式部分被分成以下子部分:(i)硬件和软件环境;(ii)示例实施例;(iii)进一步的评论和/或实施例;以及(iv)定义。
I.硬件和软件增强
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211123115.0/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理