[发明专利]数据流通系统及方法在审

专利信息
申请号: 201611194959.9 申请日: 2016-12-21
公开(公告)号: CN106815313A 公开(公告)日: 2017-06-09
发明(设计)人: 汤奇峰;武文杰 申请(专利权)人: 上海数据交易中心有限公司
主分类号: G06F17/30 分类号: G06F17/30;G06F21/62;G06Q10/10
代理公司: 北京集佳知识产权代理有限公司11227 代理人: 张振军,吴敏
地址: 200034 上海*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 数据 流通 系统 方法
【说明书】:

技术领域

发明涉及数据流通领域,尤其涉及一种数据流通系统及方法。

背景技术

在数据流通领域,数据流通是指数据供应方向数据需求方提供数据的行为,其中,所述数据是数据供应方经过沉淀、购买、抓取或其他合法手段获得的。

首先,在数据流通领域,普遍存在海量非结构化的数据结构难以统一和没有规范标的物的问题,不同的数据提供方的数据结构不同。在数据流通和数据管理过程中,由于流通数据的数据结构不统一,需要对流通数据进行规约、整合、分类。

其次,数据的收集、处理、交易及应用都面临着违法的风险。如何在隐私保护基础上促进数据资源的流动,是目前面临的现实问题,亟需开展理论研究。在数据流通监管的层面,亟需通过技术手段减小数据流通监测的计算量和成本。

发明内容

本发明解决的技术问题是如何减小数据流通监测的计算量和成本。

为解决上述技术问题,本发明实施例提供一种数据流通系统,所述数据流通系统包括:

数据标签定义模块,适于接收运营方对流通数据的维度主键和标签值的定义,所述流通数据具有多个第一维度,所述多个第一维度包括所述维度主键和所述标签值;流通数据挂牌模块,适于接收供应方选择的所述标签值以及基于所述多个第一维度填写的所述流通数据;流通数据查询模块,适于接收需求方的查询条件,并基于所述查询条件对所述流通数据进行查询和筛选,确定所需流通数据;电子合同生成模块,适于在确定所述所需流通数据后,生成电子合同,所述电子合同包括所述所需流通数据且具备多个第二维度,所述多个第二维度包括所述所需流通数据的多个第一维度。

可选的,所述数据流通系统还包括:合同分类统计模块,适于基于所述多个第二维度对所述电子合同进行统计,以实现对所述流通数据的监测。

可选的,所述多个第一维度还包括主体标识、流通限制条件、时间约束条件和价格约束条件。

可选的,所述多个第二维度还选自:所述电子合同的生成时间、订单数量、所述所需流通数据的供应方信息以及所述所需流通数据的需求方信息。

可选的,所述流通数据查询模块在所述查询条件与所述流通数据的主体标识、维度主键、标签值、流通限制条件、时间约束条件和价格约束条件相匹配时,将所述流通数据作为所述所需流通数据。

可选的,所述流通限制条件可以包括以下一种或多种:对象描述、关键词、语种、来源行业、加工方式、敏感度、可识别性、授权方式、应用场景、遍历方式约束、覆盖度、成员约束、行业约束、企业性质约束、数据来源、质量评分、安全评分、风险评分。

可选的,所述合同分类统计模块包括:合同获取子模块,适于基于预设条件选取待统计数据,所述待统计数据包括多个电子合同,每一电子合同对应一个数据集;聚类子模块,适于基于所述多个第二维度对多个数据集进行聚类,得到聚类结果,所述聚类结果包括多个数据集合,每一数据集合包括至少一个数据集;筛选子模块,适于在所述多个数据集合中筛选出异常集合。

可选的,所述筛选子模块计算所述聚类结果中所有数据集合中数据集数量的平均值以及标准差,并在当前数据集合的数据集数量与所述平均值的差值与所述标准差比值小于设定阈值时,判定所述当前数据集合为所述异常集合。

可选的,所述聚类子模块包括:选取子模块,适于从所述待统计数据中选取设定数量的所述数据集作为初始聚类中心;第一计算子模块,适于计算其他数据集与所述初始聚类中心的距离;划分子模块,适于将所述其他数据集划分至距离最近的所述初始聚类中心所在的集合;迭代子模块,适于迭代更新每一集合的聚类中心,并计算所述其他数据集与所述聚类中心的距离并划分至距离最近的所述聚类中心所在的集合,直至所有集合收敛,得到聚类结果。

可选的,所述聚类子模块采用K-prototypes算法进行聚类。

为解决上述技术问题,本发明实施例还公开了一种数据流通方法,数据流通方法包括:接收运营方对流通数据的维度主键和标签值的定义,所述流通数据具有多个第一维度,所述多个第一维度包括所述维度主键和标签值;接收供应方选择的所述标签值以及基于所述多个第一维度填写的所述流通数据;接收需求方的查询条件,并基于所述查询条件对所述流通数据进行查询和筛选,确定所需流通数据;在确定所述所需流通数据后,生成电子合同,所述电子合同包括所述所需流通数据且具备多个第二维度,所述多个第二维度包括所述所需流通数据的多个第一维度。

可选的,所述数据流通方法还包括:基于所述多个第二维度对所述电子合同进行统计,以实现对所述流通数据的监测。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海数据交易中心有限公司,未经上海数据交易中心有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201611194959.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top