[发明专利]地址解析方法、电子设备及介质在审
申请号: | 202111370407.X | 申请日: | 2021-11-18 |
公开(公告)号: | CN114139558A | 公开(公告)日: | 2022-03-04 |
发明(设计)人: | 韩宝龙;孙玉霞;何蜀波;邹宇 | 申请(专利权)人: | 携程科技(上海)有限公司 |
主分类号: | G06F40/58 | 分类号: | G06F40/58;G06F16/31;G06F16/387;G06F40/126;G06F40/216;G06F40/242;G06N20/00 |
代理公司: | 上海弼兴律师事务所 31283 | 代理人: | 马涛;罗朗 |
地址: | 200335 上海市长宁区金钟*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 地址 解析 方法 电子设备 介质 | ||
1.一种地址解析方法,其特征在于,包括步骤:
S1、建立地址实体字典,所述地址实体字典包括若干实体地址以及与所述实体地址所对应的翻译文本;
所述实体地址包括若干字符,所述字符按照编码排序,所述实体地址按照所述字符的排序进行排序;
S2、将需要翻译的地址与所对应的所述实体地址匹配;
所述将需要翻译的地址与所对应的所述实体地址匹配包括:
对所述需要翻译的地址按照三叉树搜索树策略与实体地址进行匹配;
所述三叉树搜索树策略为对所述需要翻译的地址中第n个字符生成预测字符,n为大于等于1的自然数;
所述预测字符为根据所述需要翻译的地址中第n个字符之前已经匹配完成的字符在实体地址字典中进行搜索的下一个可能的字符,
当所述需要翻译的地址中第n个字符的排序大于/小于所述预测字符的排序,则生成下一个预测字符;
所述需要翻译的地址中第n个字符的排序等于所述预测字符的排序时,则完成所述第n个字符的匹配,并对n加1;
当所述需要翻译的地址中第n个字符在实地地址字典中没有所述预测字符时,将所述需要翻译的地址中第n个字符作为下一个需要翻译的地址的第一个字符,并确定原所述需要翻译的地址与所对应的所述实体地址匹配完成;
当确定原所述需要翻译的地址与所对应的所述实体地址匹配完成时,将所述需要翻译的地址替换为与需要翻译的地址所匹配的实体地址相对应的所述翻译文本。
2.如权利要求1所述的地址解析方法,其特征在于,所述预测字符为在所述实体地址字典中根据匹配完成的字符中选取下一可能的字符中历史出现最多的字符;
当所述需要翻译的地中第n个字符与所述预测字符进行匹配成功的时候,将所述字符所出现的次数进行累加。
3.如权利要求1所述的地址解析方法,其特征在于,所述预测字符有三个;
第一个所述预测字符为当前所述实体地址字典中可能出现的字符中排序最小的字符;
第二个所述预测字符为所述第一个所述预测字符为当前所述实体地址字典中可能出现的字符中排序为中位数的字符;
第三个所述预测字符为所述第一个所述预测字符为当前所述实体地址字典中可能出现的字符中排序最大的字符。
4.如权利要求1所述的地址解析方法,其特征在于,将所述实体地址建立矩阵,所述矩阵包括若干行,所述实体地址按照实体地址信息对应分配至对应的行中,并赋予行与行之间不同的权重,所述行与行之间不同的权重用于判断每个实体地址前后所对应的最合适的实体地址。
5.如权利要求4所述的地址解析方法,其特征在于,
所述实体地址信息包括国家、省级单位、市级单位、区单位、县单位、街道以及标志性建筑。
6.如权利要求1所述的地址解析方法,其特征在于,
步骤S1还包括S11、在文本中识别需要翻译的地址的范围;
步骤S2还包括S21、将所述翻译文本输出。
7.如权利要求6所述的地址解析方法,其特征在于,
步骤S11还包括对于文本进行预处理并将需要翻译的地址进行占位符替换;
步骤S21还包括将所述翻译文本倒序排列并将替换所述占位符。
8.如权利要求1所述的地址解析方法,其特征在于,
所述字符按照编码排序按照unicode码排序。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至8中任一项所述的地址解析方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至8中任一项所述的地址解析方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于携程科技(上海)有限公司,未经携程科技(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111370407.X/1.html,转载请声明来源钻瓜专利网。