[发明专利]一种互联网大数据分析提取方法及系统在审
申请号: | 201811315842.0 | 申请日: | 2018-11-07 |
公开(公告)号: | CN109344333A | 公开(公告)日: | 2019-02-15 |
发明(设计)人: | 钟文洪 | 申请(专利权)人: | 乐甜人工智能科技(广州)有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/903;G06F16/906;G06F21/60 |
代理公司: | 南京鼎傲知识产权代理事务所(普通合伙) 32327 | 代理人: | 王晶 |
地址: | 511300 广东省广州市增*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 大数据 特征提取 筛选 互联网 分析 加密 存储 采集 模块发送指令 数据采集单元 数据传输单元 数据加密单元 数据筛选模块 数据特征提取 互联网数据 数据安全性 安全性能 工作效率 后台终端 人工成本 数据通过 提取效率 预先设置 准确度 发送 传输 | ||
1.一种互联网大数据分析提取方法,其特征在于:分析提取方法包括以下步骤:
A、数据采集单元采集互联网大数据;
B、采集的数据经过数据筛选模块进行筛选后发送至控制单元进行处理;
C、控制单元向数据特征提取模块发送指令,对筛选后的数据根据预先设置的关键字进行特征提取;
D、特征提取后的数据通过数据加密单元进行加密后存储;
E、最后提取后的互联网数据通过数据传输单元传输至后台终端。
2.根据权利要求1所述的一种互联网大数据分析提取方法,其特征在于:所述步骤B中数据筛选模块方法如下:
a、从待筛选数据中提取多个噪声数据作为样本数据;
b、对各所述样本数据进行变换处理,得到各所述样本数据的变换数据;
c、通过预先训练好的数据分类模型,对各所述样本数据及各所述变换数据进行标签预测,确定各样本数据的目标标签和目标标签概率;
d、根据各样本数据的目标标签及目标标签概率,对各样本数据进行筛选,获得目标数据。
3.根据权利要求1所述的一种互联网大数据分析提取方法,其特征在于:所述步骤D中数据加密方法如下:
a、首先对待加密的数据进行清洗操作;
b、之后对清洗后的数据进行AES加密算法运算,得到加密后的一次密文数据;
c、之后对一次密文数据再次进行超混沌加密运算,得到二次密文数据;
d、最后对二次密文数据进行进行DES加密运算,完成对数据的最终加密。
4.根据权利要求1所述的一种互联网大数据分析提取方法,其特征在于:所述数据特征提取模块特征提取方法如下:
a、建立数据集,其中数据集中包含待特征提取的多个子数据集;
b、对数据集进行特征训练,得到训练模型;
c、提取数据集中的第一关键字和第二关键字;
d、循环搜索数据集中各子数据集,以第一关键字和第二关键字为初始条件,对子数据集进行搜索;
e、各子数据集中搜索匹配到第一关键字或第二关键字,则对数据进行提取。
5.一种互联网大数据分析提取系统,其特征在于:包括控制单元(1)、数据采集单元(2)、数据筛选单元(3)、数据特征提取单元(4)、数据加密存储单元(5)和数据输出单元(6),所述数据采集单元(2)通过数据筛选单元(3)连接控制单元(1),所述控制单元(1)分别连接数据特征提取单元(4)、数据加密存储单元(5)和数据输出单元(6);其中,所述数据采集单元(2)用于采集互联网大数据;所述数据筛选单元(3)用于对互联网大数据进行筛选,去除干扰信息;所述数据特征提取单元(4)用于对筛选后的数据进行特征提取;所述数据加密存储单元(5)用于对特征提取后的互联网大数据进行加密存储。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于乐甜人工智能科技(广州)有限公司,未经乐甜人工智能科技(广州)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811315842.0/1.html,转载请声明来源钻瓜专利网。