[发明专利]数据流通系统及方法在审
申请号: | 201611194959.9 | 申请日: | 2016-12-21 |
公开(公告)号: | CN106815313A | 公开(公告)日: | 2017-06-09 |
发明(设计)人: | 汤奇峰;武文杰 | 申请(专利权)人: | 上海数据交易中心有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F21/62;G06Q10/10 |
代理公司: | 北京集佳知识产权代理有限公司11227 | 代理人: | 张振军,吴敏 |
地址: | 200034 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 流通 系统 方法 | ||
技术领域
本发明涉及数据流通领域,尤其涉及一种数据流通系统及方法。
背景技术
在数据流通领域,数据流通是指数据供应方向数据需求方提供数据的行为,其中,所述数据是数据供应方经过沉淀、购买、抓取或其他合法手段获得的。
首先,在数据流通领域,普遍存在海量非结构化的数据结构难以统一和没有规范标的物的问题,不同的数据提供方的数据结构不同。在数据流通和数据管理过程中,由于流通数据的数据结构不统一,需要对流通数据进行规约、整合、分类。
其次,数据的收集、处理、交易及应用都面临着违法的风险。如何在隐私保护基础上促进数据资源的流动,是目前面临的现实问题,亟需开展理论研究。在数据流通监管的层面,亟需通过技术手段减小数据流通监测的计算量和成本。
发明内容
本发明解决的技术问题是如何减小数据流通监测的计算量和成本。
为解决上述技术问题,本发明实施例提供一种数据流通系统,所述数据流通系统包括:
数据标签定义模块,适于接收运营方对流通数据的维度主键和标签值的定义,所述流通数据具有多个第一维度,所述多个第一维度包括所述维度主键和所述标签值;流通数据挂牌模块,适于接收供应方选择的所述标签值以及基于所述多个第一维度填写的所述流通数据;流通数据查询模块,适于接收需求方的查询条件,并基于所述查询条件对所述流通数据进行查询和筛选,确定所需流通数据;电子合同生成模块,适于在确定所述所需流通数据后,生成电子合同,所述电子合同包括所述所需流通数据且具备多个第二维度,所述多个第二维度包括所述所需流通数据的多个第一维度。
可选的,所述数据流通系统还包括:合同分类统计模块,适于基于所述多个第二维度对所述电子合同进行统计,以实现对所述流通数据的监测。
可选的,所述多个第一维度还包括主体标识、流通限制条件、时间约束条件和价格约束条件。
可选的,所述多个第二维度还选自:所述电子合同的生成时间、订单数量、所述所需流通数据的供应方信息以及所述所需流通数据的需求方信息。
可选的,所述流通数据查询模块在所述查询条件与所述流通数据的主体标识、维度主键、标签值、流通限制条件、时间约束条件和价格约束条件相匹配时,将所述流通数据作为所述所需流通数据。
可选的,所述流通限制条件可以包括以下一种或多种:对象描述、关键词、语种、来源行业、加工方式、敏感度、可识别性、授权方式、应用场景、遍历方式约束、覆盖度、成员约束、行业约束、企业性质约束、数据来源、质量评分、安全评分、风险评分。
可选的,所述合同分类统计模块包括:合同获取子模块,适于基于预设条件选取待统计数据,所述待统计数据包括多个电子合同,每一电子合同对应一个数据集;聚类子模块,适于基于所述多个第二维度对多个数据集进行聚类,得到聚类结果,所述聚类结果包括多个数据集合,每一数据集合包括至少一个数据集;筛选子模块,适于在所述多个数据集合中筛选出异常集合。
可选的,所述筛选子模块计算所述聚类结果中所有数据集合中数据集数量的平均值以及标准差,并在当前数据集合的数据集数量与所述平均值的差值与所述标准差比值小于设定阈值时,判定所述当前数据集合为所述异常集合。
可选的,所述聚类子模块包括:选取子模块,适于从所述待统计数据中选取设定数量的所述数据集作为初始聚类中心;第一计算子模块,适于计算其他数据集与所述初始聚类中心的距离;划分子模块,适于将所述其他数据集划分至距离最近的所述初始聚类中心所在的集合;迭代子模块,适于迭代更新每一集合的聚类中心,并计算所述其他数据集与所述聚类中心的距离并划分至距离最近的所述聚类中心所在的集合,直至所有集合收敛,得到聚类结果。
可选的,所述聚类子模块采用K-prototypes算法进行聚类。
为解决上述技术问题,本发明实施例还公开了一种数据流通方法,数据流通方法包括:接收运营方对流通数据的维度主键和标签值的定义,所述流通数据具有多个第一维度,所述多个第一维度包括所述维度主键和标签值;接收供应方选择的所述标签值以及基于所述多个第一维度填写的所述流通数据;接收需求方的查询条件,并基于所述查询条件对所述流通数据进行查询和筛选,确定所需流通数据;在确定所述所需流通数据后,生成电子合同,所述电子合同包括所述所需流通数据且具备多个第二维度,所述多个第二维度包括所述所需流通数据的多个第一维度。
可选的,所述数据流通方法还包括:基于所述多个第二维度对所述电子合同进行统计,以实现对所述流通数据的监测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海数据交易中心有限公司,未经上海数据交易中心有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611194959.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种驾驶员评价方法及装置
- 下一篇:基于幅值相位混合建模的图像检索方法
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置