[发明专利]数据分类方法及装置在审
申请号: | 201711131428.X | 申请日: | 2017-11-15 |
公开(公告)号: | CN110019797A | 公开(公告)日: | 2019-07-16 |
发明(设计)人: | 黄双全;唐玉建;范英;康凯;郝瑞朝;邹继文;王鑫;顾智海;袁新武;田浩 | 申请(专利权)人: | 公安部户政管理研究中心;航天信息股份有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35 |
代理公司: | 北京合智同创知识产权代理有限公司 11545 | 代理人: | 李杰 |
地址: | 100070 北京市丰台区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分类信息 地址数据 数据分类 地址信息记录 关键字信息 分类属性 人口信息 记录 分类 城乡 | ||
本发明提供了一种数据分类方法及装置。该数据分类方法包括:获取待分类信息;确定所述待分类信息中的地址数据对应的地址信息记录,根据所述地址数据对应的地址信息记录确定所述待分类信息的户籍分类属性;或者,确定所述待分类信息中的地址数据中的关键字对应的关键字信息记录,根据所述地址数据中的关键字对应的关键字信息记录,确定所述待分类信息的户籍分类属性。通过该数据分类方法可以实现对人口信息数据的城乡属性进行分类。
技术领域
本发明涉及数据处理技术领域,尤其涉及一种数据分类方法及装置。
背景技术
依据公安部《关于配合户籍制度改革中期评估开展人口信息数据分析有关工作意见的报告》、以及《人口管理大数据应用级建模技术研究需求分析报告》和《人口管理大数据应用级建模技术研究需求评审》,分析2016年以来全国户籍人口城镇化率变动情况。
户籍人口城乡分类信息由地方各级公安机关人口管理部门进行人工标识、上报。由于各省级单位使用的人口管理信息系统不一,人口基本信息维护与业务变动备案尚未建立相互校验,以及户籍业务信息中城乡分类人工标识等诸多原因,使得人口数据质量问题较大,户籍迁移城乡分类信息标识完整性、准确性不高,其他变动信息城乡分类信息尚未标识,同时户籍地址更新的时效性远远落后于实际地址的变动,使得不便于统计人口城镇化率,人口城镇化率的统计数据准确性和可靠性不足。
发明内容
有鉴于此,本发明实施例提供一种数据分类方法及装置,以解决现有技术中人口信息数据的城乡分类属性不全的问题。
本发明实施例提供一种数据分类方法,其包括:获取待分类信息;确定所述待分类信息中的地址数据对应的地址信息记录,根据所述地址数据对应的地址信息记录确定所述待分类信息的户籍分类属性;或者,确定所述待分类信息中的地址数据中的关键字对应的关键字信息记录,根据所述地址数据中的关键字对应的关键字信息记录,确定所述待分类信息的户籍分类属性。
可选地,确定所述待分类信息中的地址数据对应的地址信息记录,根据所述地址数据对应的地址信息记录确定所述待分类信息的户籍分类属性,包括:确定与所述地址数据匹配的标准地址信息记录,所述标准地址信息记录包含标准地址信息数据和对应的户籍分类属性,将匹配的所述标准地址信息记录中的户籍分类属性确定为所述待分类信息的户籍分类属性。
可选地,确定所述待分类信息中的地址数据对应的地址信息记录,根据所述地址数据对应的地址信息记录确定所述待分类信息的户籍分类属性,还包括:若所述标准地址信息记录与所述地址数据不匹配,则确定与所述地址数据的省市县数据匹配的行政区划城乡分类信息记录中的省市县数据,若匹配的省市县数据对应的户籍分类属性为城镇,则确定所述待分类信息的户籍分类属性为城镇;或者,若匹配的省市县数据对应的户籍分类属性不为城镇,则确定所述匹配的省市县数据对应的区划详址中包含的乡镇名称数据中与所述地址数据的乡镇名称数据匹配的乡镇名称数据,若匹配的所述乡镇名称数据的户籍分类属性明确,则所述待分类信息的户籍分类属性为匹配的所述乡镇名称数据的户籍分类属性;或者,若匹配的所述乡镇名称数据的户籍分类属性不明确,则确定所述匹配的乡镇名称数据对应的区划详址中包含的村委会或居委会名称数据中与所述地址数据的村委会或居委会名称数据匹配的村委会或居委会名称数据,所述待分类信息的户籍分类属性为匹配的村委会或居委会名称数据对应的户籍分类属性。
可选地,确定所述待分类信息中的地址数据中的关键字对应的关键字信息记录,根据所述地址数据中的关键字对应的关键字信息记录,确定所述待分类信息的户籍分类属性,包括:若所述匹配的省市县数据对应的区划详址中包含的乡镇名称数据与所述地址数据的乡镇名称数据不匹配,或者匹配的乡镇名称数据对应的区划详址中包含的村委会或居委会名称数据与所述地址数据的村委会或居委会名称数据不匹配,则提取所述地址数据中的关键字;确定所述关键字信息记录中与所述地址数据中的关键字匹配的关键字数据,所述关键字信息记录中包含关键字数据和对应的户籍分类属性,则确定待分类信息的户籍分类属性为匹配的关键字数据对应的户籍分类属性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于公安部户政管理研究中心;航天信息股份有限公司,未经公安部户政管理研究中心;航天信息股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711131428.X/2.html,转载请声明来源钻瓜专利网。