[发明专利]一种计算企业实际经营地的方法在审
| 申请号: | 202110330113.8 | 申请日: | 2021-03-26 |
| 公开(公告)号: | CN112989166A | 公开(公告)日: | 2021-06-18 |
| 发明(设计)人: | 唐杰;徐超;陈雨馨;梁协君 | 申请(专利权)人: | 杭州有数金融信息服务有限公司 |
| 主分类号: | G06F16/953 | 分类号: | G06F16/953;G06F40/20 |
| 代理公司: | 北京崇智知识产权代理有限公司 11605 | 代理人: | 马良 |
| 地址: | 310000 浙江省杭州*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 计算 企业 实际 经营 方法 | ||
1.一种计算企业实际经营地的方法,其步骤包括:
步骤1:当某个用户查询某个企业的实际经营地址时,通过数据公开网站获取该企业的地址,及其地址所对应的发布日期;
步骤2:通过已训练的地址信息提取模型从步骤1所述的地址中提取到省,市,县(区),街道,路,路-号,园区,园区-栋,园区-栋-楼,园区-栋-楼-号数据,即该企业地址信息结构化数据;
步骤3:通过已训练的行政区划映射模型将步骤2中提取到的企业地址信息结构化数据映射为标准规范的通用行政区划描述数据;
步骤4:根据步骤3所述的企业标准规范的通用行政区划描述数据计算该企业地址的初始得分,具体公式为:
s0=v1×p+v2×c+v3×x+v4×j+max(v5×w+v6×wh,v7×y+v8×yd+v9×ydl+v10×ydlh)
其中,p,c,x,j,w,wh,y,yd,ydl,ydlh分别对应表示省,市,县(区),街道,路,路-号,园区,园区-栋,园区-栋-楼,园区-栋-楼-号的取值;如果企业标准规范的通用行政区划描述数据中有对应行政区划的值,则该行政区划对应变量的取值为1,否则取值为0;v1,v2,v3,v4,v5,v6,v7,v8,v9,v10则是对应指标的权重,根据经验和大量实验调整后得出最合适的值分别为:30,25,20,15,5,5,7,2,0.5,0.5;
步骤5:根据步骤4所诉的企业地址初始得分s0和地址的发布日期计算该企业地址的实际得分,具体公式为:
其中,s表示所述企业地址的实际得分,tm表示当前日期,tn表示所述企业地址的发布日期,tm-tn则为发布日期距离今天的天数差(向下取整),S0表示所诉企业地址的初始得分;
步骤6:根据步骤5所诉的企业地址实际得分,按分数对所诉企业地址进行倒序排序,如果同一个分数对应多个地址,则再按发布日期进行二次倒序排序,将排名第一的地址输出,即为该用户查得该企业的实际经营地址。
2.根据权利要求1所诉的方法,其特征在于,所诉地址信息提取模型的训练步骤包括:
获取多个目标企业地址;
分别标注出每个所诉目标地址中的目标省,市,县(区),街道,路,路-号,园区,园区-栋,园区-栋-楼,园区-栋-楼-号;
获取所诉目标地址信息提取问题;
将所诉目标地址,所诉目标地址信息提取问题做为输入特征,将相应的所诉目标省市县等地址信息做为期望的输出特征,对长久记忆神经网络进行训练获得已训练的地址信息提取模型。
3.根据权利要求1所诉的方法,其特征在于,所诉行政区划映射模型的训练步骤包括:
获取多个目标行政区划描述数据,区分省,市,县,街道等;
分别标注出每个所诉目标行政区划中的需要对应的标准规范的省,市,县,街道等描述;
将所诉目标行政区划描述做为输入特征,将相应的所诉目标行政区划对应的标准描述做为期望的输出特征,对长久记忆神经网络进行训练获得已训练的行政区划映射模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州有数金融信息服务有限公司,未经杭州有数金融信息服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110330113.8/1.html,转载请声明来源钻瓜专利网。





