[发明专利]大数据的分析方法、及数据分析服务器在审
申请号: | 201910729084.5 | 申请日: | 2019-08-08 |
公开(公告)号: | CN110674182A | 公开(公告)日: | 2020-01-10 |
发明(设计)人: | 陈少海;刘泉明;罗茂锐 | 申请(专利权)人: | 厦门久凌创新科技有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/28 |
代理公司: | 35101 厦门原创专利事务所(普通合伙) | 代理人: | 徐东峰;黄一敏 |
地址: | 361000 福建省厦门市软*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 大数据 维度 数据挖掘 兴趣度 度量 数据分析服务器 动态确定 特征信息 应用场景 综合考虑 挖掘 聚类簇 聚类 表现 分析 保证 统一 服务 | ||
本发明提供一种大数据的分析方法、及数据分析服务器,通过综合考虑不同兴趣度度量维度,以对每个维度的所有业务大数据进行聚类后,可以保证不同兴趣度度量维度在不同的数据挖掘项目待应用场景下性能表现更加统一,提高大数据挖掘的能力,并且可以根据各聚类簇的特征信息,动态确定待挖掘服务的多个数据挖掘项目。
技术领域
本申请涉及大数据技术领域,具体而言,涉及一种大数据的分析方法、 装置及数据分析服务器。
背景技术
目前针对各个线上业务(例如订单行为业务、浏览行为业务等)等大 数据挖掘方案,大多仅限使用一种兴趣度度量维度,虽然部分关注于不同 兴趣度度量维度方式的属性和行为的研究,但是针对某个待挖掘服务,不 同兴趣度度量维度在不同的数据挖掘项目待应用场景下,性能表现不一, 其使用局限性限制了在大数据挖掘的能力。并且,在整个数据挖掘过程中, 需要先对数据进行分析,然后才能确定挖掘项目。然而,现有的分析方法 无法进行多维度的分析,并准确获得挖掘项目。
发明内容
为了至少克服现有技术中的上述不足,本申请的目的之一在于提供一 种一种大数据的分析方法、装置及数据分析服务器。
第一方面,本申请提供一种大数据的分析方法,应用于与待分析服务 所对应的各个业务服务器通信连接的数据分析服务器,所述方法包括:
从各个业务服务器中获取多个维度的业务大数据,并针对每个维度, 对该维度的所有业务大数据进行聚类,得到每个维度的聚类簇;
提取每个维度的聚类簇的特征信息,并根据每个维度的聚类簇的特征 信息,确定所述待挖掘服务的多个数据挖掘项目。
在第一方面的一种可能的设计中,所述根据每个维度的聚类簇的特征 信息,确定所述待挖掘服务的多个数据挖掘项目的步骤,包括:
从所述每个维度的聚类簇的特征信息中分析得到高贡献值特征与低贡 献值特征;
计算所述高贡献值特征在所述每个维度的聚类簇的特征信息中的第一 占比以及所述低贡献值特征在所述每个维度的聚类簇的特征信息中的第二 占比;
根据所述第一占比和所述第二占比确定所述待挖掘服务的多个数据挖 掘项目。
在第一方面的一种可能的设计中,所述根据所述第一占比和所述第二 占比确定所述待挖掘服务的多个数据挖掘项目的步骤,包括:
根据所述第一占比与第一设定值之间的第一差值,以及所述第二占比 与第二设定值之间的第二差值,分别确定高贡献值特征的第一挖掘系数和 低贡献值特征的第二挖掘系数;
根据所述第一挖掘系数和所述第二挖掘系数确定高贡献值特征所对应 的数据挖掘项目的第一比例和低贡献值特征所对应的数据挖掘项目的第二 比例;
根据所述第一比例和所述第二比例确定所述待挖掘服务的多个数据挖 掘项目。
第二方面,本申请实施例提供一种数据分析服务器,包括处理器、存 储器和网络接口。其中,存储器、网络接口处理器之间可以通过总线系统 相连。网络接口用于接收报文,存储器用于存储程序、指令或代码,处理 器用于执行存储器中的程序、指令或代码,以完成上述第一方面或第一方 面的任意可能的设计方式中的所执行的操作。
第三方面,本申请实施例提供一种计算机可读存储介质,计算机可读 存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述第 一方面或第一方面的任意可能的设计方式中的方法。
基于上述任意一个方面,本申请通过综合考虑不同兴趣度度量维度, 以对每个维度的所有业务大数据进行聚类后,可以保证不同兴趣度度量维 度在不同的数据挖掘项目待应用场景下性能表现更加统一,提高大数据挖 掘的能力,并且可以根据各聚类簇的特征信息,动态准确的获取待挖掘服 务的多个数据挖掘项目。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门久凌创新科技有限公司,未经厦门久凌创新科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910729084.5/2.html,转载请声明来源钻瓜专利网。