[发明专利]知识图谱构建方法、装置、信息穿透方法和系统在审
| 申请号: | 202010644740.4 | 申请日: | 2020-07-07 |
| 公开(公告)号: | CN111813956A | 公开(公告)日: | 2020-10-23 |
| 发明(设计)人: | 叶彩萍;洪伙彪;何思略;刘洋 | 申请(专利权)人: | 中国工商银行股份有限公司 |
| 主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/901;G06F40/30;G06N5/04 |
| 代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 王涛;任默闻 |
| 地址: | 100140 北*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 知识 图谱 构建 方法 装置 信息 穿透 系统 | ||
本发明提供了一种知识图谱构建方法、装置、信息穿透方法和系统,所述方法包含:获取待分析目标的注册信息数据源和网页数据源,根据所述注册信息数据源和所述网页数据源构建领域本体信息;利用所述领域本体信息构建Karma模型,并通过Karma模型对所述注册信息数据和所述网页数据信息进行数据融合分析获得第一RDF数据;基于所述领域本体信息通过Jena推理引擎对所述第一RDF数据进行补全修正后获得第二RDF数据,根据所述第二RDF数据通过Neo4j图数据库构建获得知识图谱。
技术领域
本发明涉及知识图谱技术领域,尤其是涉及一种知识图谱构建方法、装置、信息穿透方法和系统。
背景技术
在大数据时代,为了高效利用海量的互联网数据,国内外互联网公司纷纷以此为基础构建知识图谱,知识图谱以其强大的知识组织能力和语义处理能力在智能问答、语义推荐、舆情分析等众多领域发挥着重要作用。但是目前针对银行大数据应用领域的知识图谱非常匮乏。
虽然银行积累了大量的客户信息和企业信息,但银行传统的数据分析和机器学习方式更多的只是将客户和企业作为单独的个体进行分析,许多客户和企业的基础信息仅仅是孤立的存在,没有实现数据之间的互联互通,没有形成统一数据标准并有效整合起来,系统无法在客户群体间和企业群体间进行深层次关系挖掘和穿透。客户经理也无法直观全面了解客户相关的企业法人、企业信息以及企业之间的关联信息,很难深度挖掘出企业最终受益人、深度挖掘和钻取目标客户信息及关联信息等有效的营销信息,无法为客户提供分层次有针对性客户服务和营销管理。基于上述的情况,客户经理只能去各大公开网站手工进行对公客户相关企业信息搜集,对客户相关企业信息进行人工分析挖掘目标客户进行营销,但一个对公客户经理的精力是有限的,无法快速有效的在海量的企业中寻找到优质重点客户。
鉴于此,如何打破企业、法人等信息孤点,实现客户企业信息的互联互通,将企业大数据高效的利用起来,进行企业集团信息穿透,解决企业集团信息壁垒问题在当前环境中尤为重要。
发明内容
本发明目的在于提供一种知识图谱构建方法、装置及信息穿透系统,实现企业数据的互联互通,将异构、多源的数据有效融合予以构建统一的知识图谱,利用该知识图谱予以展现更精准的目标数据。
为达上述目的,本发明所提供的知识图谱构建方法,所述方法包含:获取待分析目标的注册信息数据源和网页数据源,根据所述注册信息数据源和所述网页数据源构建领域本体信息;利用所述领域本体信息构建Karma模型,并通过Karma模型对所述注册信息数据和所述网页数据信息进行数据融合分析获得第一RDF数据;基于所述领域本体信息通过Jena推理引擎对所述第一RDF数据进行补全修正后获得第二RDF数据,根据所述第二RDF数据通过Neo4j图数据库构建获得知识图谱。
在上述知识图谱构建方法中,优选的,获取待分析目标的注册信息数据源和网页数据源,根据所述注册信息数据源和所述网页数据源构建领域本体信息包含:于所述注册信息数据源中获得注册信息数据,将所述网页数据源转化为结构化数据后获得网页数据信息;根据所述注册信息数据和所述网页数据信息分析获得两者各自的数据属性及两者之间的语义关联关系;根据所述数据属性和所述语义关联关系构建领域本体信息。
在上述知识图谱构建方法中,优选的,利用所述领域本体信息构建Karma模型包含:根据所述注册信息数据和所述网页信息数据构建多源化结构数据;利用CRF模型学习语义分析所述多源化结构数据与所述领域本体信息之间的映射关系;通过所述领域本体信息和所述映射关系构建Karma模型。
在上述知识图谱构建方法中,优选的,通过Jena推理引擎对所述第一RDF数据进行推理补全获得第二RDF数据包含:通过Jena推理引擎分析所述第一RDF数据中各数据之间的层次关系,将所述层次关系补入所述第一RDF数据中,获得第二RDF数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010644740.4/2.html,转载请声明来源钻瓜专利网。





