[发明专利]一种企业归属分类的方法及系统在审
申请号: | 202210070106.3 | 申请日: | 2022-01-21 |
公开(公告)号: | CN114463053A | 公开(公告)日: | 2022-05-10 |
发明(设计)人: | 吴呈良;郑敏 | 申请(专利权)人: | 浪潮卓数大数据产业发展有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06K9/62 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 阚恭勇 |
地址: | 214125 江苏省无锡市无锡经济开发区金融一街15号110*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 企业 归属 分类 方法 系统 | ||
本发明提供一种企业归属分类的方法及系统,属于数据处理领域,本发明通过对采集得到的企业公开数据进行方法和流程设计,将企业数据进行标准化,为企业打上省份、城市和区县三级地域标签,将企业进行明确的归属地分类,进而方便后续企业销售数据在地域维度方面的统计和分析。
技术领域
本发明涉及统计分析和数据处理等技术领域,尤其涉及一种企业归属分类的方法及系统。
背景技术
统计分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。通过对数据进行统计分析,进而得出相应的结论,这些结论可以帮助人们做出判断,以便采取适当行动。
数据处理是对数据的采集、存储、检索、加工、变换和传输,是从大量的、可能是杂乱无章的、难以理解的数据中抽取并推导出对于某些特定的人们来说是有价值、有意义的数据。数据处理是系统工程和自动控制的基本环节,贯穿于社会生产和社会生活的各个领域,极大地影响着人类社会发展的进程。
企业作为市场经营活动中的参与者,不管是在线上还是线下,都发挥着十分重要的作用。如何根据企业工商注册信息而准确有效划分企业在地域维度上的归属,进而对该企业在地域维度上的销售情况和在地域维度上汇总的企业销售情况进行监测和分析,成为对当下经营活动研究的一个重点和难点。
发明内容
为了解决以上技术问题,本发明提供了一种企业归属分类的方法,达到有效利用采集得到的企业数据并对企业归属地进行准确有效分类,进而总结分地域销售热点的目的,特对企业进行地域标准化处理。
本发明的技术方案是:
一种企业归属分类的方法,包括:
第一步,数据采集,对网上企业公开信息进行采集,将采集得到的原始数据存放到数据库中;
第二步,数据清洗,对采集到的原始数据进行清洗和降噪处理;
第三步,数据校验,对清洗后的数据进行检查和校验;
第四步,数据分类,采集到的数据经过清洗和校验后,将企业相关数据,输入到数据分类装置,对企业进行归属地划分;
第五步,数据补采,针对未完成分类的企业,进行数据补采后,重复上述步骤进行再次分类;
第六步,数据展示,对完成企业归属分类的企业进行可视化展示,包括地图、表格、文档。
第七步,数据分析,对完成行政区划归属分类的企业,结合其他相关数据,进行后续在地域维度上的分析和监控。
进一步的,
数据清洗处理包括:去除无关和错误字符(空格、乱码、多余文字),字符转为英文半角符号,重复数据剔除,空值数据补充。
数据校验包括包括完整性、唯一性、非空性方面的检查校验;对数据进行抽样,与网页展示的原始数据进行比对,保证数据的准确性。
数据分类对企业进行归属地划分,包括:
1)输入分类项,此处为标准的地域行政区划表;
2)输入待分类数据,包括企业名称、统一社会信用代码、登记机关、地址;
3)对企业进行归属地分类,依次采用如下方法进行:
3.1)根据企业登记机关获取行政区划三级归属信息;
3.2)根据企业登记地址获取行政区划三级归属信息;
3.3)根据企业统一社会信用代码获取行政区划三级归属信息;
3.4)根据企业名称获取行政区划三级归属信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮卓数大数据产业发展有限公司,未经浪潮卓数大数据产业发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210070106.3/2.html,转载请声明来源钻瓜专利网。