[发明专利]一种企业征信人名重名消歧的方法及运用该方法的征信系统在审
| 申请号: | 201710843051.4 | 申请日: | 2017-09-18 |
| 公开(公告)号: | CN107577791A | 公开(公告)日: | 2018-01-12 |
| 发明(设计)人: | 王云丽 | 申请(专利权)人: | 河北省科学院应用数学研究所 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q30/00 |
| 代理公司: | 石家庄开言知识产权代理事务所(普通合伙)13127 | 代理人: | 赵俊娇 |
| 地址: | 050000 河北省石家庄*** | 国省代码: | 河北;13 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 企业 人名 重名 方法 运用 系统 | ||
1.一种企业征信人名重名消歧的方法,适于在计算机设备中执行,该方法包括:
步骤a):检索出企业征信系统中企业关键人物包含某一确定人名的所有企业组成的合集,其中每一个企业实体都自成一个类簇;
步骤b):对步骤a)得到的各个元素,进行两两运算,计算任意两个企业的关键人物姓名的相似度值,若得到至少一个相似度值为1,则将两个企业归入到同一个类簇之下,否则不归入;
步骤c):根据步骤b)得到的类簇,比较任两个类簇的企业之间的投资参股关系,若发现某两个类簇内企业之间存在着投资参股关系,则将存在投资参股关系的企业所对应的类簇归并为一个类簇,否则不归并;
步骤d):根据步骤c)得到的类簇,罗列各类簇中企业名称,提取企业字号,计算任两个类簇内企业字号之间的相似度值,若计算某两个类簇内企业字号存在至少一个相似度值为1的情况,则将该两个类簇归并为一个类簇,否则不归并;
步骤e):构建爬虫程序,爬取企业之间的业务往来关系,比较步骤d)得到的类簇中任两个类簇的企业之间业务往来关系,将存在关联业务关系的企业所对应的类簇归并为一个类簇,否则不归并;
步骤f):对步骤e)处理后得到的类簇进行两两运算,判断任两个类簇内企业注册地址的匹配度,若判断某两个类簇内企业注册地址存在相匹配的情况,则将该两个类簇归并为一个类簇,否则不归并;
以上步骤,除步骤a)之外,在一个步骤无法执行或无法完全执行时,将自动跳转到下一步,并将已经得到的计算结果作为该步骤完成执行后的结果转交到下一步;
经过上述运算,得到不同的类簇,使因该确定人名而重名的人被区分。
2.根据权利要求1所述的方法,其特征在于:步骤a)中所述的企业关键人物包括企业的法人代表、股东及高级管理人员。
3.根据权利要求1所述的方法,其特征在于:所述步骤c)所述的投资参股关系是通过数据爬虫得到,具体是通过构建爬虫程序,爬取网络资料中有关某一个企业的义项,获得一个类簇中包含的所有的公司的对外投资清单,比较这些清单中的企业名称是否存在与另一个类簇中所包含的企业名称相同的情况,若存在相同的情况;则将这两个类簇合并为一个类簇;否则不合并。
4.根据权利要求1所述的方法,其特征在于:步骤d)所述的提取企业字号,依据企业名称是由行政区划+字号+行业属性+组织形式构成的特性,采用双向最大匹配法或神经网络(可参见2008年,麦范金,王挺发表于现代图书情报技术的文章基于双向最大匹配和HMM的分词消歧模型和1993年,徐秉铮,詹剑,贺前华发表于中文信息学报的文章基于神经网络的分词方法)提取企业字号。
5.根据权利要求1所述的方法,其特征在于:步骤b)所述计算两个企业关键人物姓名的相似度值的计算公式为:
其中S表示一个企业中的一个关键人物姓名的字符串,T表示另外一个企业中一个关键人物姓名的字符串,card(·)表示集合中元素个数,sim(·)表示相似度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河北省科学院应用数学研究所,未经河北省科学院应用数学研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710843051.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种图像搜索方法及装置
- 下一篇:一种企业数据自动聚类的方法及其系统





