[发明专利]基于深度学习的地址数据解析方法在审
| 申请号: | 202010011871.9 | 申请日: | 2020-01-07 |
| 公开(公告)号: | CN111209362A | 公开(公告)日: | 2020-05-29 |
| 发明(设计)人: | 张磊;陶虹;张旭方 | 申请(专利权)人: | 苏州城方信息技术有限公司 |
| 主分类号: | G06F16/29 | 分类号: | G06F16/29;G06F16/35;G06F40/289;G06N20/00 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 215006 江苏省苏州市工业园*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 深度 学习 地址 数据 解析 方法 | ||
1.一种基于深度学习的地址数据解析方法,其特征在于,包括:
将地址数据按照地址解析要求映射到相应关键地块信息进行多维度的数据标注,标注后的关键地块信息数据具有不同类别的标签地址名称内容文本;
将所述多维度标注的地址名称内容文本进行分词处理生成地址训练数据;
构建BiLSTM-CNN-CRF模型进行训练;
将所述的地址训练数据按序排列,通过词嵌入确定词段结构关联性,并输出相应的词向量;
通过BiLSTM模型和CNN模型将所述词向量按正向序列和反向序列分别结合上下文的关联信息融合学习并得到状态向量,该状态向量再次提取到BiLSTM模型中训练后并输送到CRF模型中,所述CRF模型自动提取序列规则并完成修正后输出关键地址序列信息;
在模型训练时,调整模型复杂度对损失函数的影响来防止模型过拟合;其中,在训练的过程中每隔5个轮次,将训练的学习率调整为原来的一半。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州城方信息技术有限公司,未经苏州城方信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010011871.9/1.html,转载请声明来源钻瓜专利网。





