[发明专利]一种用于金融行业的地址分词方法有效
| 申请号: | 202010657240.4 | 申请日: | 2020-07-09 |
| 公开(公告)号: | CN111859956B | 公开(公告)日: | 2021-08-27 |
| 发明(设计)人: | 苏明富;雷军;曾忠晨;陈浩 | 申请(专利权)人: | 睿智合创(北京)科技有限公司 |
| 主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/205;G06F16/35;G06F16/29;G06K9/62;G06Q40/00 |
| 代理公司: | 北京冠和权律师事务所 11399 | 代理人: | 张楠楠 |
| 地址: | 100000 北京市密云区鼓楼东大街3号山水*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 用于 金融 行业 地址 分词 方法 | ||
本发明是关于用于金融行业的地址分词方法。该方法包括:接收输入的当前地址;调用预先建立的行政区划数据库;根据所述行政区划数据库,提取所述当前地址中的行政区划信息;根据所述行政区划信息进行地址分词,以获得地址分词结果;输出所述地址分词结果。通过本发明的技术方案,可避免采用现有通用中文分词解析出地址要素而导致准确率比较低,以充分提高地址分词的准确性,实现对金融行业用户所填写的地址信息的地址要素的准确提取。
技术领域
本发明涉及分词技术领域,尤其涉及一种用于金融行业的地址分词方法。
背景技术
目前,金融行业的客户地址信息主要来源于客户的填写,只有地址字符串可以利用,同时由于客户个人习惯、地域特征等不同,客户填写的地址不够规范。所以需要对地址进行分词,把客户填写地址字符串划分成有效的标准地址要素。而现有地址提取方法为基于现有通用中文分词技术对地址字符串进行分词,然后再根据分词结果进行地址要素的提取。但由于通用中文分词解析出来的地址要素准确率比较低,因而,影响了地址分词的准确性。
发明内容
本发明实施例提供了用于金融行业的地址分词方法。所述技术方案如下:
根据本发明实施例提供了一种用于金融行业的地址分词方法,包括:
接收输入的当前地址;
调用预先建立的行政区划数据库;
根据所述行政区划数据库,提取所述当前地址中的行政区划信息;
根据所述行政区划信息进行地址分词,以获得地址分词结果;
输出所述地址分词结果。
在一个实施例中,所述方法还包括:
当所述行政区划信息提取失败时,将所述当前地址进行显示,以提示用户对所述当前地址进行行政区划信息的识别;
当所述行政区划信息识别成功时,利用成功识别的所述行政区划信息,对所述行政区划数据库进行自动更新;
当所述行政区划信息识别失败时,确认所述当前地址中的行政区划信息错误;
对所述行政区划信息进行自动纠错,并利用纠错后的所述行政区划信息对所述行政区划数据库进行自动更新。
在一个实施例中,所述根据所述行政区划信息进行地址分词,以获得地址分词结果,包括:
提取所述行政区划信息下的地址分割词和与所述地址分割词对应的分割参数;
根据所述地址分割词和所述分割参数,进行地址分词,以获得所述地址分词结果。
在一个实施例中,所述方法还包括:
调用预先建立的标准地址库;
将所述地址分词结果与所述标准地址库进行匹配;
若所述地址分词结果与所述标准地址库相匹配,则确认所述地址分词结果正确;
若所述地址分词结果与所述标准地址库不匹配,则确认所述地址分词结果错误。
在一个实施例中,所述若所述地址分词结果与所述标准地址库不匹配,则确认所述地址分词结果错误,包括:
若所述地址分词结果与所述标准地址库不匹配,将所述地址分词结果进行显示,以提示所述地址分词结果是否正确;
当所述地址分词结果正确时,利用所述地址分词结果对所述标准地址库进行更新,以获得更新后的所述标准地址库。
在一个实施例中,所述方法还包括:
确定各地域常用的地址分割词;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于睿智合创(北京)科技有限公司,未经睿智合创(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010657240.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种建筑装饰用玻璃清洗装置
- 下一篇:一种基于骨架提取的人体非线性变换算法





