[发明专利]地址关系模型的训练方法和装置、地址解析方法和装置在审
| 申请号: | 201910709061.8 | 申请日: | 2019-08-01 |
| 公开(公告)号: | CN112395434A | 公开(公告)日: | 2021-02-23 |
| 发明(设计)人: | 刘楚;郑华飞;谢朋峻;李林琳;司罗 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
| 主分类号: | G06F16/387 | 分类号: | G06F16/387;G06F40/295 |
| 代理公司: | 北京展翼知识产权代理事务所(特殊普通合伙) 11452 | 代理人: | 屠长存 |
| 地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 地址 关系 模型 训练 方法 装置 解析 | ||
1.一种地址文本解析方法,其特征在于,包括:
获取地址文本;
获取所述地址文本所包含的多个地址元素;
确定所述多个地址元素的地址关系,
其中,所述地址关系包括所述多个地址元素之间的关联关系,所述关联关系包括并列关系或偏序关系。
2.根据权利要求1所述的方法,其特征在于,所述获取地址文本所包含的多个地址元素的步骤包括:
对所述地址文本进行分词处理,以获得所述多个地址元素。
3.根据权利要求1所述的方法,其特征在于,所述确定所述多个地址元素的地址关系的步骤包括:
对所述多个地址元素进行解析,确定所述地址元素所属的级别;
基于所述地址元素所属的级别,确定所述多个地址元素的地址关系。
4.根据权利要求3所述的方法,其特征在于,
所述地址关系包括所述多个地址元素之间的指向关系,
所述指向关系包括从对应于较低级别的地址元素指向对应于较高级别的地址元素。
5.根据权利要求1所述的方法,其特征在于,所述确定所述多个地址元素的地址关系的步骤还包括:
基于所述多个地址元素以及预设的地址元素关系,确定所述多个地址元素的地址关系,所述预设的地址元素关系包括预设的地址元素之间的关联关系。
6.根据权利要求5所述的方法,其特征在于,还包括:
维护地址关系表,所述地址关系表包括所述预设的地址元素关系。
7.根据权利要求5所述的方法,其特征在于,所述预设的地址元素关系包括下述的至少一项:自指关系;子元素关系;同义元素关系;同等级元素关系;辅助关系;同级非同义关系。
8.根据权利要求1-7中任何一项所述的方法,其特征在于,所述确定所述多个地址元素的地址关系的步骤包括:
利用训练好的地址关系模型,确定多个地址元素的地址关系。
9.根据权利要求8所述的方法,其特征在于,
所述地址关系模型是基于地址文本及其相对应的地址关系训练得到的。
10.根据权利要求9所述的方法,其特征在于,所述利用训练好的地址关系模型确定多个地址元素的地址关系的步骤包括:
将所述地址文本以及所述多个地址元素,输入所述地址关系模型,以得到所述多个地址元素的地址关系。
11.根据权利要求10所述的方法,其特征在于,还包括:
基于所述多个地址元素以及预设的地址元素关系,确定所述多个地址元素的地址关系,所述预设的地址元素关系包括预设的地址元素之间的关联关系;以及
以利用所述地址关系模型确定的地址元素的地址关系,作为基于所述预设的地址元素关系确定的地址元素的地址关系的补充。
12.根据权利要求8所述的方法,其特征在于,所述确定所述多个地址元素的地址关系的步骤还包括:
基于多个地址元素的地址关系,生成对应于所述地址文本的地址关系图。
13.根据权利要求12所述的方法,其特征在于,
采用拓扑排序,构建所述地址关系图。
14.根据权利要求12所述的方法,其特征在于,
所述地址关系图用于地址服务。
15.根据权利要求1所述的方法,其特征在于,所述获取地址文本的步骤包括:
从地址数据库中获取所述地址文本,其中,所述地址数据库包括基于多种来源获取的文本。
16.根据权利要求1所述的方法,其特征在于,
所述地址关系是基于图模型构建的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910709061.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:文字特效处理方法及装置
- 下一篇:文字特效处理方法及装置





