[发明专利]一种企业归属分类的方法及系统在审
申请号: | 202210070106.3 | 申请日: | 2022-01-21 |
公开(公告)号: | CN114463053A | 公开(公告)日: | 2022-05-10 |
发明(设计)人: | 吴呈良;郑敏 | 申请(专利权)人: | 浪潮卓数大数据产业发展有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06K9/62 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 阚恭勇 |
地址: | 214125 江苏省无锡市无锡经济开发区金融一街15号110*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 企业 归属 分类 方法 系统 | ||
1.一种企业归属分类的方法,其特征在于,
包括:
第一步,数据采集,对网上企业公开信息进行采集,将采集得到的原始数据存放到数据库中;
第二步,数据清洗,对采集到的原始数据进行清洗和降噪处理;
第三步,数据校验,对清洗后的数据进行检查和校验;
第四步,数据分类,采集到的数据经过清洗和校验后,将企业相关数据,输入到数据分类装置,对企业进行归属地划分;
第五步,数据补采,针对未完成分类的企业,进行数据补采后,重复上述步骤进行再次分类;
第六步,数据展示,对完成企业归属分类的企业进行可视化展示,
第七步,数据分析,对完成行政区划归属分类的企业,结合其他相关数据,进行后续在地域维度上的分析和监控。
2.根据权利要求1所述的方法,其特征在于,
数据清洗处理包括:去除无关和错误字符(空格、乱码、多余文字),字符转为英文半角符号,重复数据剔除,空值数据补充。
3.根据权利要求1所述的方法,其特征在于,
数据校验包括包括完整性、唯一性、非空性方面的检查校验;对数据进行抽样,与网页展示的原始数据进行比对,保证数据的准确性。
4.根据权利要求1所述的方法,其特征在于,
数据分类对企业进行归属地划分,包括:
1)输入分类项,此处为标准的地域行政区划表;
2)输入待分类数据,包括企业名称、统一社会信用代码、登记机关、地址;
3)对企业进行归属地分类,依次采用如下方法进行:
3.1)根据企业登记机关获取行政区划三级归属信息;
3.2)根据企业登记地址获取行政区划三级归属信息;
3.3)根据企业统一社会信用代码获取行政区划三级归属信息;
3.4)根据企业名称获取行政区划三级归属信息;
3.5)特殊企业将根据企业名称、统一社会信用代码、登记机关、地址等信息综合获取行政区划三级归属信息。
4)输出企业行政区划归属分类结果。
5.根据权利要求1所述的方法,其特征在于,
数据展示的内容包括地图、表格、文档。
6.一种企业归属分类的系统,其特征在于,
包括:
数据采集装置,对网上企业公开信息进行采集,将采集得到的原始数据存放到数据库中;
数据清洗装置,对采集到的原始数据进行清洗和降噪处理;
数据校验装置,对清洗后的数据进行检查和校验;
数据分类装置,采集到的数据经过清洗和校验后,将该部分的企业相关数据,输入到数据分类装置,对企业进行归属地划分:
数据补采装置,针对数据分类装置未完成分类的企业,进行数据补采后,让数据分类装置进行再次分类;
数据展示装置,对完成企业归属分类的企业进行可视化展示;
数据分析装置,对完成行政区划归属分类的企业,结合其他相关数据,进行后续在地域维度上的分析和监控。
7.根据权利要求6所述的系统,其特征在于,
数据清洗处理包括:去除无关和错误字符(空格、乱码、多余文字),字符转为英文半角符号,重复数据剔除,空值数据补充。
8.根据权利要求6所述的系统,其特征在于,
数据校验包括包括完整性、唯一性、非空性方面的检查校验;对数据进行抽样,与网页展示的原始数据进行比对,保证数据的准确性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮卓数大数据产业发展有限公司,未经浪潮卓数大数据产业发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210070106.3/1.html,转载请声明来源钻瓜专利网。