[发明专利]基于XGBoost回归与卷积网络的数据资产分析方法、系统及介质在审

专利信息
申请号: 202110767832.6 申请日: 2021-07-07
公开(公告)号: CN113205093A 公开(公告)日: 2021-08-03
发明(设计)人: 李志杰 申请(专利权)人: 浙江中科华知科技股份有限公司
主分类号: G06K9/32 分类号: G06K9/32;G06K9/62;G06N3/04;G06N3/08;G06N20/20;G06Q30/06
代理公司: 杭州华知专利事务所(普通合伙) 33235 代理人: 张德宝
地址: 311121 浙江省杭州市*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 xgboost 回归 卷积 网络 数据 资产 分析 方法 系统 介质
【说明书】:

发明公开的一种基于XGBoost回归与卷积网络的数据资产分析方法、系统及介质,其中方法包括:采集数据资产信息形成数据链得到图像类数据资产特征集以及非图像类数据资产特征集;将所述非图像类数据资产特征集作为XGBoost算法的输入进行回归分析得到第一结果;将所述图像类数据资产特征集与所述非图像类数据资产特征集共同作为所述XGBoost算法的输入进行回归分析得到第二结果;计算目标偏差率,与预设的比率阈值进行比较,以输出最终结果。本发明能够实现图像类数据资产与非图像类数据资产的共同处理,使得分析的数据资产范围覆盖广;同时通过设定偏差值可进一步确保数据资产分析的准确性与可靠性;利用XGBoost算法扩充了对于数据资产价值分析的监管权利与力度。

技术领域

本发明涉及数据分析和处理技术领域,更具体的,涉及一种基于XGBoost回归与卷积网络的数据资产分析方法、系统及介质。

背景技术

随着大数据和人工智能的快速发展,今天的数据不仅为科学提供创新,也能直接创造财富——数据在流动、运行的过程中产生庞大的经济规模:欧盟地区8%的GDP是从数据中产生的。人们愈发认识到,数据不只是资源,更是资产。而数据资产化面临诸多技术难点,其一是数据的产权模糊:数据具有可复制性,当今互联网普遍奉行“谁采集谁拥有”的潜规则,使得侵犯隐私、数据泄露的问题比比皆是;此外,由于数据经由网络可以流通使用,使得数据最终拥有者很难界定;其二是数据孤岛问题:流通的数据由于其安全性以及归属属性难以保障,因此数据不流通成为了人们的选择,从而形成数据孤岛,降低数据的有效性和价值;其三是数据的定价和估值困难:由于数据的非竞争性和无限共享性,使得数据的潜在价值大,价值链长;此外,由于不同主体对于相同数据的需求角度不同,使得他们利用相同数据所挖掘的价值不同,导致了数据的价值难以得到静态的准确厘定。

由于数据资产不具有实物形态,估值时通常类比无形资产,在行业实践中,无形资产价值的评估方法包括成本法、收益法和市场法三种基本方法及其衍生方法。但由于数据资产相比于无形资产还具有“有效期短、可以无限共享、集合使用价值更高”等特点,因此传统的三种评估方法在应用于数据资产上具有局限性。

目前,利用将数据整理分析后形成对外服务的数据商品层出不穷,例如一些平台利用云计算、机器学习等领先科技从用户信用历史、行为偏好、履约能力、身份特质、人脉关系五个维度对用户的信用进行评估,从而客观呈现个人和企业的商业信用状况,将其打包出售给商户,使其可以选择在租赁、购物、商旅出行、本地生活等众多商业场景中满足条件的用户信息。此种打包出售方式,大多根据信息数量、信息质量等因素进行数据资产定价,不能提现数字资产的价值潜力以及实质价值;再比如一些电商平台根据消费者总量、消费者品类购买力、消费者转化力三个指标将品牌消费者数据视为资产,通过数据的全链路透视使得消费者数据资产变得可评估、可优化、可运营,品牌商由此可以直观地看到相应的消费者资产,估算其商业价值并用于帮助其营销决策。而此种方式忽略了数字资产的更新速度快、定价需要动态调整的特点;此外数据资产价值确定的指标需要针对不同主体而决定,而不能固态的选择单调的三个指标进行全部资产的评定;此外一些现有的数据资产管理平台通过元数据对信息资产特征进行描述,并以目录形式分类管理,但是其算法流程复杂,顾客仍不能看到“算法黑箱”的内部构造,用户对于算法结果的自主选择权无法得以实现。

发明内容

鉴于上述问题,本发明的目的是提供一种基于XGBoost回归与卷积网络的数据资产分析方法、系统及介质,通过两种算法实现图像类数据资产与非图像类数据资产的共同处理,以确保数据分析的准确性与可靠性。

本发明第一方面提供了一种基于XGBoost回归与卷积网络的数据资产分析方法,包括以下步骤:

采集数据资产信息形成数据链,以获取图像类数据资产像素集;

通过训练好的卷积神经网络模型提取所述图像类数据资产像素集的特征值得到图像类数据资产特征集;

利用预设的特征提取算法提取所述数据链中的非图像类文件得到非图像类数据资产特征集;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江中科华知科技股份有限公司,未经浙江中科华知科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110767832.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top