[发明专利]数据评分方法及装置在审
| 申请号: | 202111235687.3 | 申请日: | 2021-10-22 |
| 公开(公告)号: | CN114004636A | 公开(公告)日: | 2022-02-01 |
| 发明(设计)人: | 谢树坤 | 申请(专利权)人: | 同盾网络科技有限公司 |
| 主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06K9/62 |
| 代理公司: | 北京知果之信知识产权代理有限公司 11541 | 代理人: | 高科;李志刚 |
| 地址: | 311121 浙江省杭州市余杭区*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 数据 评分 方法 装置 | ||
本公开提供一种数据评分方法及装置,所述方法包括获取拟评分样本数据集,根据表征所述拟评分样本数据集的特征对所述拟评分样本数据集进行分类,获取多个样本类别;按照预设匹配规则,确定与所述多个样本类别对应的第一评分模型;根据所述第一评分模型,获取每个样本类别中每个样本数据对应的第一评分;基于所述第一评分确定每个样本数据在其所在样本类别中的排序位置,通过预设的第二评分模型,确定每个样本类别中每个样本数据对应的第二评分。本公开提供的数据评分方法能够减少建模所需数量,并且能够将模型评分进行分数映射,使得特征较为丰富类别样本对应的模型结果更可靠。
技术领域
本公开涉及数据处理技术领域,尤其涉及一种数据评分方法及装置。
背景技术
现有对数据进行评分的方法主要包括三种:
第一、基于单一模型对多分布数据进行评分,
其主要是利用主流的逻辑回归、树模型、神经网络等建模方法对全部的数据进行建模,然后直接利用建好的模型对需要评分的数据进行打分,将模型打分的结果做为最终结果;
基于单一模型对多分布数据进行建模这种方法,在全部数据集不是很大的情况下,模型可能更多侧重拟合某些场景下占比较大的数据集,例如针对孕期女性,母婴类产品的数据集相比于其他产品在该场景下占比较大,而对于占比较大的数据集,模型不管是训练过程中,还是实际分析过程中,对占比较大的数据集利用率均更高,因此模型更加侧重拟合占比较大的数据集,对占比较小的数据集拟合度不够,会造成一定程度的精度损失。
第二、基于多个模型对多分布数据进行评分,
其主要是在已知数据集包括不同业务形态时,可以根据业务划分抽取出不同的数据集,然后分别建模和评分;
基于不同分布形态的数据各自建模这种方法,如果业务形态众多,那么整个数据集的数据分布会特别复杂,模型数量过多,各自建模成本过高。
第三、对多分布形态的数据进行分类,然后构建独立的模型,再通过独立的模型对多分布数据进行评分
第三种方法主要是利用数据集的字段/特征,划分数据类别,其中,划分方法可以包括人工规则、聚类等方法,然后对划分后的数据集分别建模和评分;
第三种方法好处是对复杂的数据分布事先进行了分类处理,宏观上减少了数据分布的量级,但是如果数据集中的数据噪声比较大,很多样本的特征值都缺失,那么聚类后的多个模型评分置信度可能差别较大,难以将多个模型的评分标准进行统一。
公开于本申请背景技术部分的信息仅仅旨在加深对本申请的一般背景技术的理解,而不应当被视为承认或以任何形式暗示该信息构成已为本领域技术人员所公知的现有技术。
发明内容
本公开实施例提供一种数据评分方法及装置,能够至少解决现有技术中的部分问题。
本公开实施例的第一方面,提供一种数据评分方法,包括:
获取拟评分样本数据集,根据表征所述拟评分样本数据集的特征对所述拟评分样本数据集进行分类,获取多个样本类别;
按照预设匹配规则,确定与所述多个样本类别对应的第一评分模型;
根据所述第一评分模型,获取每个样本类别中每个样本数据对应的第一评分;
基于所述第一评分确定每个样本数据在其所在样本类别中的排序位置,通过预设的第二评分模型,确定每个样本类别中每个样本数据对应的第二评分。
在一种可选的实施方式中,
所述方法还包括:
根据表征所述拟评分样本数据集的特征,通过聚类算法对所述拟评分样本数据集进行分类,获取分类后拟评分样本数据集中每个样本类别中每个样本数据的相关参数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同盾网络科技有限公司,未经同盾网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111235687.3/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





