[发明专利]敏感数据的基于规则的文档清理在审
| 申请号: | 201980032483.4 | 申请日: | 2019-05-13 |
| 公开(公告)号: | CN112740213A | 公开(公告)日: | 2021-04-30 |
| 发明(设计)人: | B·布恩;D·钱德纳尼;陈柱;R·K·唐图拉;M·S·T·伊万斯;A·尼尔;V·尤帕亚;G·斯坦夫;S·巴萨瓦;E·斯特申科;C·布罗查;S·米勒;X·时 | 申请(专利权)人: | 微软技术许可有限责任公司 |
| 主分类号: | G06F21/62 | 分类号: | G06F21/62 |
| 代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 黄倩 |
| 地址: | 美国华*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 敏感数据 基于 规则 文档 清理 | ||
基于规则的属性机制通过基于脚本的规则的应用,分析以不同格式的具有不同数据类型的文档,该基于脚本的规则将标签应用于文档,以标识在该文档中包含的敏感数据的类型。具有类似标签的文档被聚合,以使得敏感数据从文档中被清理,留下遥测数据可用于下游处理。清理需要不同的动作,诸如消除敏感数据、模糊敏感数据以及将敏感数据转换为非敏感值。
本申请要求于2018年5月16日提交的序列号为62/672,071的美国临时申请的权益。
背景技术
遥测是自动记录和传输来自远程点的测量数据。遥测通常被用于软件产品中,以研究用户在现实环境中参与产品的情况。遥测数据提供对以下项的有价值的见解:用户最常使用的特征、用户使用产品的频率、用户最常选择的设置和选项、产品发生崩溃的频率、用户使用产品遇到崩溃、缺陷和问题的上下文以及产品的整体性能。本质上,遥测数据让开发者了解软件产品在现实环境中是怎样运行的。然而,遥测数据可能偶尔包括与软件产品的性能无关的敏感信息。
发明内容
本“发明内容”被提供用来以简化的形式介绍概念的选集,这些概念的选集将会在下面的“具体实施方式”中进一步地描述。本“发明内容”不旨在标识所要求保护的主题的关键特征或必要特征,也不旨在用于限制所要求保护的主题的范围。
基于规则的属性技术被用于从包括遥测数据的文档中清理敏感数据。基于规则的属性技术通过基于脚本的规则的应用来分析以不同格式的具有不同类型的数据的文档,该基于脚本的规则将标签应用到文档,以标识在文档中包含的个人数据的类型。具有类似标签的文档被聚合,以使得所标识的个人数据以类似的方式被清理,留下遥测数据可用于下游处理。清理需要不同的动作,诸如消除敏感数据、模糊敏感数据以及将个人数据转换为一般格式。
通过阅读以下详细的描述和审阅相关附图,这些和其他特征以及优点将显而易见。应当理解,前述大致的描述和下面详细的描述两者都只是解释性的,并且不限制所要求保护的方面。
附图说明
图1图示了执行敏感数据的基于规则的文档清理的示例性系统。
图2A-图2D是图示了基于规则的文档清理的示例的示意图。
图3是图示了用于使用规则从文档中清理敏感数据的示例性方法的流程图。
图4是图示了用于执行特定的动作以从文档中清理敏感数据的示例性方法的流程图。
图5是图示了操作环境的框图。
图6是图示了对于群组用户的示例性规则的示意图。
图7图示了用来均匀化从具有不同事件格式的三个不同产品中生成的事件数据的示例性规则的示意图。
具体实施方式
概述
遥测数据是在用户参与软件产品的过程中,在不同时间发生不同事件时生成的。为了深入了解软件产品的特定问题,来自不同来源的几个不同的遥测数据片段可能需要被分析,以了解问题的原因和影响。遥测数据可以存在于不同的文档中,这些文档可以是不同的格式,包含不同的字段和特性,因此很难将文档中的需要用来了解问题的所有数据集合起来。在某些情况下,遥测数据可以包括需要被保护以防止未经授权的公开的敏感数据。敏感数据可以是任何类型的信息,诸如但不限于机密数据和/或个人数据。
为了克服这一障碍,本文所公开的主题使用基于规则的属性技术来标识文档中可能需要被过滤、消除或清理的敏感数据,以使得潜在的遥测数据被保留以用于下游处理。该规则解释了遥测数据驻留其中的不同类型的文档以及数据在文档中驻留其中的不同字段和/或特性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980032483.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于授权的用户检测的神经形态系统
- 下一篇:低共熔提取物形成和纯化





