[发明专利]具有主成分分析的混合数据指纹在审
| 申请号: | 201780086812.4 | 申请日: | 2017-11-20 |
| 公开(公告)号: | CN110431551A | 公开(公告)日: | 2019-11-08 |
| 发明(设计)人: | 马丁·罗斯;梁芷苓·克里斯蒂娜;迈克尔·安德森 | 申请(专利权)人: | 链睿有限公司 |
| 主分类号: | G06F17/12 | 分类号: | G06F17/12;G06F17/16;G06T1/00;G06T1/20 |
| 代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 唐杰敏 |
| 地址: | 美国加利*** | 国省代码: | 美国;US |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 数据集 主成分分析 参考文件 成分模式 混合数据 数据集中 数据减少 数据提供 压缩 加指纹 构建 可用 子集 指纹 应用 统计 | ||
1.一种用于确定野生文件是否从数据所有者数据集泄漏的装置,其中所述数据所有者数据集和所述野生文件各自包括多个记录,每个记录包括多个字段,所述装置包括:
a.子集选择子例程,其中所述子集选择子例程被配置成接收数据所有者数据集和经日期调整的野生文件,并且创建数据所有者子集和野生文件子集,其中所述数据所有者子集和所述野生文件子集分别包含与所述数据所有者数据集和所述野生文件相比减少的记录数;
b.PCAmix数据分析子例程,其中所述PCAmix数据分析子例程被配置成接收所述数据所有者子集和所述野生文件子集,并且产生一组数据所有者子集特征值、一组数据所有者子集特征向量、一组野生文件子集特征值、以及一组野生文件子集特征向量;以及
c.分数生成子例程,其中所述分数生成子例程被配置成接收所述数据所有者子集特征值、所述数据所有者子集特征向量、所述野生文件子集特征值、和所述野生文件子集特征向量,以产生指示所述野生文件源自所述数据所有者数据集的可能性的相似性分数。
2.如权利要求1所述的装置,其特征在于,进一步包括:文件日期确定子例程,其被配置成分析所述野生文件并调整所述野生文件中的日期以计及自从所述野生文件被泄漏起所流逝的时间,以便产生经日期调整的野生文件。
3.如权利要求2所述的装置,其特征在于,进一步包括:记录匹配例程,其被配置成接收所述经日期调整的野生文件和所述数据所有者数据集,并在所述经日期调整的野生文件和所述数据所有者数据集之间产生一组匹配的记录。
4.如权利要求1所述的装置,其特征在于,所述PCAmix数据分析子例程被进一步配置成:构建数值数据矩阵、从来自所述数值数据矩阵的行权重构造的第一对角矩阵、以及从来自所述数值数据矩阵的列权重构造的第二对角矩阵。
5.如权利要求4所述的装置,其特征在于,所述PCAmix数据分析子例程被进一步配置成:使用来自所述第一和第二对角矩阵的度量来对所述数值数据矩阵执行广义奇异值分解,以产生所述数据集所有者子集特征向量和所述野生文件子集特征向量。
6.如权利要求5所述的装置,其特征在于,所述PCAmix数据分析子例程被进一步配置成:消除除了占方差的显著部分的那些数据集所有者子集特征向量和野生文件子集特征向量之外的所有数据集所有者子集特征向量和野生文件子集特征向量。
7.如权利要求6所述的装置,其特征在于,所述PCAmix数据分析子例程被进一步配置成:消除除了占方差的至少百分之十的那些数据集所有者子集特征向量和野生文件子集特征向量之外的所有数据集所有者子集特征向量和野生文件子集特征向量。
8.一种用于为数据所有者数据集创建指纹的装置,其中所述数据所有者数据集包括多个记录,每个记录包括多个字段,所述装置包括:
a.子集选择子例程,其中所述子集选择子例程被配置成接收数据所有者数据集并从所述数据所有者数据集创建数据所有者子集,其中所述数据所有者子集包含与所述数据所有者数据集相比减少数目的记录;以及
b.PCAmix数据分析子例程,其中所述PCAmix数据分析子例程被配置成接收所述数据所有者子集并产生一组数据所有者子集特征值和一组数据所有者子集特征向量、一组野生文件特征值。
9.如权利要求8所述的装置,其特征在于,所述PCAmix数据分析子例程被进一步配置成:构建数值数据矩阵、从来自所述数值数据矩阵的一组行权重构造的第一对角矩阵、以及从来自所述数值数据矩阵的一组列权重构造的第二对角矩阵。
10.如权利要求9所述的装置,其特征在于,所述PCAmix数据分析子例程被进一步配置成:使用来自所述第一和第二对角矩阵的一组度量来对所述数值数据矩阵执行广义奇异值分解,以产生所述数据集所有者子集特征向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于链睿有限公司,未经链睿有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780086812.4/1.html,转载请声明来源钻瓜专利网。





