[发明专利]数据处理方法、装置以及计算机可读介质在审
| 申请号: | 201910032176.8 | 申请日: | 2019-01-14 |
| 公开(公告)号: | CN109783708A | 公开(公告)日: | 2019-05-21 |
| 发明(设计)人: | 刘远祥;陈捷;栾江霞;袁欢;韩凌凌 | 申请(专利权)人: | 厦门市美亚柏科信息股份有限公司 |
| 主分类号: | G06F16/906 | 分类号: | G06F16/906;G06F16/951;G06Q10/06 |
| 代理公司: | 厦门福贝知识产权代理事务所(普通合伙) 35235 | 代理人: | 郝学江 |
| 地址: | 361000 福建省厦门市*** | 国省代码: | 福建;35 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 维度 计算机可读介质 数据处理 得分确定 权重计算 分类 预设 预警 | ||
提供了数据处理方法、装置以及计算机可读介质。所述方法包括按照预设的维度指数对与企业相关的数据进行分类;使用分类的数据分别计算每个维度指数;基于所计算的维度指数以及每个维度指数的权重计算企业的得分;以及基于得分确定是否预警。
技术领域
本公开涉及数据处理技术,并且具体地涉及用于处理互联网数据的方法、装置以及计算机可读介质。
背景技术
随着互联网的快速发展,已成为人们获取信息的主要载体。大量企业相关的信息都能通过网络获取,比如企业的生产经营数据、招聘信息、法律诉讼数据、工商注册数据等。通过对这些数据的收集更新,就可以对企业的发展状况具有一定的了解,从而对存在经营异常的企业进行预警,保护投资者的利益。
现有的企业风险指标方法,通过定义层次化的指标对企业的经营状况进行预警,一种方式是从企业的经营数据出发,另一种是依赖企业的舆情数据。而随着互联网的发展,对企业的生产经营评价,既要重视起生产经营数据,也要重视互联网舆情的影响,特别是对一些本身就是互联网的企业,如现在大量存在的网贷公司,就很容易受到网络舆情的影响。因此评价企业风险,需要将两者有机结合起来,共同预测企业的生产经营状况。
鉴于以上,需要综合考虑企业的生产经营数据与舆情数据,将两者的评价方式统一起来,共同应用于企业生产经营风险的预测,保护投资者的利益。
发明内容
根据一个方面,提供了一种数据处理方法,包括:按照预设的维度指数对与企业相关的数据进行分类;使用分类的数据分别计算每个维度指数;基于所计算的维度指数以及每个维度指数的权重计算企业的得分;以及基于得分确定是否预警。
可附加和/或可替换地,与企业相关的数据可以通过互联网爬虫从互联网获取。
可附加和/或可替换地,在对数据进行分类之前,可以数据进行预处理,去除标点、数字等无意义的符号信息。
可附加和/或可替换地,如果企业的得分超出预定阈值,则针对企业进行预警,并输出得分。
可附加和/或可替换地,预设的维度指数可以包括不可信指数、不稳定指数、收益率指数、投诉类指数和资金流指数,等等。
可附加和/或可替换地,企业的得分可以计算为:
企业的得分=α1*不可信指数+α2*不稳定指数+α3*受益指数+α4*投诉类指数+α5*资金流指数
上式中α1,α2,α3,α4,α5为权重,可以根据业务需求进行调节,取值范围为[0,1],且满足
可附加和/或可替换地,
不可信指数=∑Ci×Si
上式中Ci代表案件类型,包括刑事案件、行政诉讼、知识产权纠纷,Si为不同案件类型所对应的值。
可附加和/或可替换地,
不稳定指数=∑Di×Si,其中Di代表企业经营变更的类型,包括法人变更、注册地址变更、注册资金变更,Si为不同变更类型所对应的值。
可附加和/或可替换地,
收益率指数=∑Ei×Si
其中Ei代表企业营收的类型,包括单个产品收益率的环比变化数据、所有产品的平均收益变化等,Si为不同收益类型所对应的值。
可附加和/或可替换地,
投诉类指数=∑Fi×Si,其中Fi代表企业负面舆情的类型,为指定周期内企业负面舆情的相对增长比率,Si为不同投诉类型所对应的值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门市美亚柏科信息股份有限公司,未经厦门市美亚柏科信息股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910032176.8/2.html,转载请声明来源钻瓜专利网。





