[发明专利]一种构建全量行政区域知识库的方法在审
| 申请号: | 201911040578.9 | 申请日: | 2019-10-29 | 
| 公开(公告)号: | CN111104519A | 公开(公告)日: | 2020-05-05 | 
| 发明(设计)人: | 胡勃 | 申请(专利权)人: | 北京海致星图科技有限公司 | 
| 主分类号: | G06F16/36 | 分类号: | G06F16/36;G06Q50/18;G06Q50/26 | 
| 代理公司: | 北京劲创知识产权代理事务所(普通合伙) 11589 | 代理人: | 张铁兰 | 
| 地址: | 100000 北京市海淀*** | 国省代码: | 北京;11 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 一种 构建 行政区域 知识库 方法 | ||
本发明公开了一种构建全量行政区域知识库的方法,建立基于时间轴的省份、城市、地区知识库,它包括以下步骤:步骤1:从民政部网站实时更新省份、城市、区县等国家数据,步骤2:从全国工商实体地址里解析出当前省市区数据,从工商变更信息里解析出历史的省市区数据。有益效果在于:本发明通过建立基于时间轴的的省份、城市、地区知识库,使得行政区域所属地的详细信息能够通过由大范围到小范围的分级方式进行实时的更新存储,确保了行政区域所属地信息的准确性以及完整性,使得行政区域所属地的查询信息更加的准确高效。
技术领域
本发明涉及到企业知识图谱技术领域,尤其涉及一种构建全量行政区域知识库的方法。
背景技术
知识图谱(Knowledge Graph),在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。
目前,由于行政区域的动态变化,企业所属的省市区也会对应做调整,而互联网上公开的省市区数据涉及到更新不及时、覆盖不全面的问题。
发明内容
本发明的目的就在于为了解决上述问题而提供一种构建全量行政区域知识库的方法。
本发明通过以下技术方案来实现上述目的:
一种构建全量行政区域知识库的方法,建立基于时间轴的省份、城市、地区知识库,它包括以下步骤:
步骤1:从民政部网站实时更新省份、城市、区县等国家数据,通过该种方式,使得该知识库能够实时准确的记录当前行政区域所属地省市区县的大范围信息,以便为当前地区的所属地提供大范围的参考;
步骤2:从全国工商实体地址里解析出当前省市区数据,从工商变更信息里解析出历史的省市区数据,通过该种方式,使得该知识库能够详细记录当前行政区域的现有所属地的详细信息,并能够记录当前行政区域历史所属地的详细信息,通过归属地变更前后信息的对比来明确当前行政区域所属地的详细信息,以便为查询提供更加全面的参考;
步骤3:从裁判文书数据里解析出法院数据,由于裁判文书都有裁判日期,故可以根据法院名称以及裁判日期解析出历史的省市区信息,通过这种方式,使得该知识库能够从法律角度来明确当前行政区域的所属区域,使得查询数据更加的具有说服力;
步骤4:对上述的所有数据进行整合,得到完整的省市区知识库,该知识库从大范围到小范围的分级方式详细记载行政区域的当前所属地以及历史所属地的详细信息,使得行政区域的信息更加的准确完整。
进一步的,所述步骤1中所用的技术为网络爬虫技术,网络爬虫又被称为网页蜘蛛、网络机器人,在FOAF社区中间,更经常的称为网页追逐者,是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本,另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫,通过采用网路爬虫技术来进行查询,使得该查询更加的迅速高效。
本发明的有益效果在于:
本发明通过建立基于时间轴的的省份、城市、地区知识库,使得行政区域所属地的详细信息能够通过由大范围到小范围的分级方式进行实时的更新存储,确保了行政区域所属地信息的准确性以及完整性,使得行政区域所属地的查询信息更加的准确高效。
具体实施方式
一种构建全量行政区域知识库的方法,建立基于时间轴的省份、城市、地区知识库,它包括以下步骤:
步骤1:从民政部网站实时更新省份、城市、区县等国家数据,通过该种方式,使得该知识库能够实时准确的记录当前行政区域所属地省市区县的大范围信息,以便为当前地区的所属地提供大范围的参考;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京海致星图科技有限公司,未经北京海致星图科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911040578.9/2.html,转载请声明来源钻瓜专利网。





