[发明专利]基于知识图谱技术的小微企业画像生成方法及装置在审
申请号: | 201910533256.1 | 申请日: | 2019-06-19 |
公开(公告)号: | CN110489560A | 公开(公告)日: | 2019-11-22 |
发明(设计)人: | 李振;刘恒;赵兴莹 | 申请(专利权)人: | 民生科技有限责任公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/28;G06Q10/10;G06Q40/00;G06Q40/02 |
代理公司: | 11401 北京金智普华知识产权代理有限公司 | 代理人: | 巴晓艳<国际申请>=<国际公布>=<进入 |
地址: | 101300 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图谱 数据处理 多层 构建 画像 企业数据网络 非结构化 企业知识 数据分析 数据整合 结构化 清晰 | ||
1.一种小微企业画像生成方法,其特征在于,所述方法通过结构化数据构建第一企业知识图谱,获取非结构化数据并提取出关系描述框架三元组关系表达式,将非结构化数据转化为结构化数据,导入到所述第一企业知识图谱形成第二企业知识图谱,基于所述第二企业知识图谱生成小微企业画像,所述方法具体包括:
步骤1:结构化数据处理;
步骤2:非结构化数据处理;
步骤3:生成小微企业画像。
2.根据权利要求1所述的方法,其特征在于,所述步骤1具体包括:
步骤11:确定为创建第一企业知识图谱所需要的结构化数据;
步骤12:将所述结构化数据以csv格式文件形式导出;
步骤13:将导出的csv格式文件导入图数据库并创建节点,给节点赋予属性值;
步骤14:在导入csv格式文件数据中查找实体,并建立实体之间的关系;
步骤15:按照上述步骤导入不同维度的实体关系,得到第一企业知识图谱。
3.根据权利要求2所述的方法,其特征在于,所述步骤2具体包括:
步骤21:对用于构建实体识别模型和关系抽取模型的第一非结构化数据进行预处理,去除不必要的信息,提取出正文,并切分为若干句子;
步骤22:标注第一样本数据作为实体识别模型的样本;
步骤23:将标注的第一样本数据分为实体识别模型训练集和实体识别模型测试集,实体识别模型训练集用于训练实体识别模型的参数,实体识别模型测试集用于测试实体识别模型是否可用;
步骤24:利用实体识别模型训练集和实体识别模型测试集对实体识别模型进行训练和测试,训练后的实体识别模型能够用于实体识别;
步骤25:标注第二样本数据作为实体间的关系抽取模型的样本;
步骤26:将标注的第二样本数据分为关系抽取模型训练集和关系抽取模型测试集,关系抽取模型训练集用于训练关系抽取模型的参数,关系抽取模型测试集用于测试关系抽取模型是否可用;
步骤27:利用关系抽取模型训练集和关系抽取模型测试集对关系抽取模型进行训练和测试,训练后的实体识别模型能够用于关系抽取;
步骤28:获取用于实体识别和关系抽取的第二非结构化数据,经过实体识别模型后识别出各个实体,再经过关系抽取模型后抽取各个实体之间的关系;
步骤29;抽取到的实体及关系以关系描述框架三元组结构进行表示,得到结构化数据,导入图数据库中,在第一企业知识图谱的基础上创建新的关系,形成第二企业知识图谱。
4.根据权利要求3所述的方法,其特征在于,所述步骤3具体包括:以小微企业为中心,通过第二企业知识图谱绘制出关系图,形成针对所述小微企业的小微企业画像。
5.根据权利要求1所述的方法,其特征在于,结构化数据来源于银行内部脱敏后的交易数据。
6.根据权利要求1所述的方法,其特征在于,非结构化数据来源于银行授信项目的信贷报告。
7.根据权利要求1所述的方法,其特征在于,所述关系描述框架三元组关系表达式为:实体,关系,实体。
8.一种小微企业画像生成装置,其特征在于,所述装置采用根据权利要求1至7中任一项所述的方法进行操作,所述装置包括:
第一知识图谱构建部件,用于将结构化数据导入图数据库中,查找实体,为实体建立关系,导入不同维度的实体关系,得到第一企业知识图谱;
第二知识图谱构建部件,用于对非结构化数据进行处理,构建实体识别模型和关系抽取模型,以关系描述框架三元组结构表示实体及关系,将非结构化数据转化为结构化数据,导入图数据库中,在第一企业知识图谱的基础上创建新的关系,形成第二企业知识图谱;
小微企业画像生成部件,以某一小微企业为中心,通过第二企业知识图谱绘制出关系图,形成针对该小微企业的小微企业画像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于民生科技有限责任公司,未经民生科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910533256.1/1.html,转载请声明来源钻瓜专利网。