[发明专利]文档安全在审

专利信息
申请号: 201780089768.2 申请日: 2017-04-20
公开(公告)号: CN110537185A 公开(公告)日: 2019-12-03
发明(设计)人: 克利斯汀·佩罗内;托马斯·保拉 申请(专利权)人: 惠普发展公司;有限责任合伙企业
主分类号: G06K9/00 分类号: G06K9/00;G06K9/46;G11C7/24
代理公司: 11018 北京德琦知识产权代理有限公司 代理人: 郭艳芳;康泉<国际申请>=PCT/US2
地址: 美国得*** 国省代码: 美国;US
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 文档 向量表示 安全规则 请求动作 特征生成 启发式 匹配 存储 关联 响应
【说明书】:

在此公开的实施例涉及:根据启发式提取模型从文档中提取多个特征;根据提取的所述多个特征生成所述文档的向量表示;将至少一个安全规则与所述文档关联;确定接收到的向量表示是否与存储的所述文档的向量表示相匹配;以及根据所述确定,提供对所述文档上的请求动作的响应。

背景技术

诸如打印机的装置通常用于复制和/或扫描文档。类似地,诸如膝上电脑和/或智能手机的装置可提供内置摄像机以允许捕获文档。在一些情形下,文档可能受到限制,例如受到复制保护的限制。

附图说明

在附图中,相同的附图标记指代相同的部件或框。以下的详细说明参考了附图,附图中:

图1是示例性提取模型的框图;

图2是用于提供文档安全的示例性系统;

图3是用于提供文档安全的方法的实施例的流程图;以及

图4是用于提供文档安全的示例性计算装置的框图。

具体实施方式

在一些情形下,诸如多功能打印机、膝上电脑和/或智能手机的装置可向用户提供捕获文档图像的功能。然而,时常地,文档可能在复制和/或分享方面受到限制,例如,当文档包含机密信息和/或特权信息时。例如,文档可能包含个人的健康信息,并且可能限于供授权的医疗服务提供方浏览和/或分享。不受限的装置易于允许对信息进行捕获和/或分享而无保护措施,但是即使是具有一定防护等级的装置,也必须捕获并比较文档的特权数据,以确定该文档是否受限。

在此讨论的一些实施方式中,可在不存储特权信息和/或机密信息的情况下提供文档安全。这种安全等级可用于防止装置未经允许捕获该信息。这些实施方式提供隐私和安全保障而不会存储该文档本身,从而核查未授权的副本。相反,可存储从文档中提取的、混淆文档内容的特征向量表示(feature vector representation),并且同时提供可关联有安全规则的唯一签名。这种特征向量表示避免了对原始文档的可能重建,从而维持了该文档在受保护文档数据库中的内部安全性。

可包括图像和/或文本特征向量的特征向量可代表图像特征的属性或者文本描述的属性。例如,图像特征向量可代表边缘、形状、区域等等。文本特征向量可代表文字的相似性、非语言类规律、基于训练文字的上下文信息、形状的描述、区域、与其他向量的接近性等等。

可在多模态空间中表示特征向量。多模态空间可包括K-维坐标系。当图像和文本特征向量填充于多模态空间中时,可通过比较多模态空间中的特征向量之间的距离以识别查询中的匹配图像,来识别相似的图像特征和文本特征。距离比较的一个实施例可包括余弦接近性(cosine proximity),其中比较该多模态空间中的特征向量之间的余弦角度以确定最接近的特征向量。在多模态空间中,余弦相似特征可能是接近的,而相异特征向量可能是远离的。特征向量可具有K-维,或者可具有多模态空间中的坐标。具有相似特征的特征向量可以以在多模态空间中彼此接近的方式嵌入向量模型中。

基于特征的向量表示可使用各种各样的模型,以在连续向量空间中表示文档的文字、图像和结构。可应用不同的技术在向量空间中表示不同的特征,并且可根据可能需要被维持的文档的数量来存储不同等级的特征。例如,可依赖于出现在相同的上下文中的文字具有相同的语义的事实,将语义上相似的文字映射到邻近点。利用了此原理的两个示例性方案包括:基于计数的模型(例如,潜在语义分析)和预测模型(例如,神经概率语言模型)。基于计数的模型计算一些文字与其在大型文本语料库中的相邻文字同时出现的统计频率,然后将这些统计计数向下映射至每个文字的小型稠密向量。预测方法直接尝试依据习得的小型稠密嵌入式向量(模型所考虑的参数)、从文字的相邻词预测该文字。其它层可捕获其它特征,例如字体类型分布、布局、图像内容和定位、色彩图等等。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于惠普发展公司;有限责任合伙企业,未经惠普发展公司;有限责任合伙企业许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201780089768.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top