[发明专利]区块链地址分类的方法和装置在审
申请号: | 202110692274.1 | 申请日: | 2021-06-22 |
公开(公告)号: | CN113535847A | 公开(公告)日: | 2021-10-22 |
发明(设计)人: | 穆长春;吕远;卿苏德;王艳辉;张凌云;吴浩 | 申请(专利权)人: | 中国人民银行数字货币研究所 |
主分类号: | G06F16/27 | 分类号: | G06F16/27;G06F16/26;G06F16/28;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 张效荣;韩黎捷 |
地址: | 100070 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 区块 地址 分类 方法 装置 | ||
本发明公开了区块链地址分类的方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:获取区块链的账本交易数据,根据所述账本交易数据构建异质图网络;根据所述异质图网络确定待分类地址的表征向量;将所述待分类地址的表征向量输入预训练的分类模型,确定所述待分类地址的分类结果。该实施方式通过将区块链的账本交易数据构建成异质图网络,不仅能够将海量交易数据的隐式业务规则特点充分表达,挖掘地址之间的复杂内在交易关联,还能够节省内存消耗、提高计算效率。
技术领域
本发明涉及计算机技术领域,尤其涉及一种区块链地址分类的方法和装置。
背景技术
区块链从本质上讲,它是一个分布式共享数据库,存储于其中的数据或信息具有“不可伪造”、“全程留痕”、“可以追溯”、“公开透明”、“集体维护”等特征。区块链UTXO(Unspent Transaction Outputs,未花费交易输出)账户模型的合法交易通常包括多个发起方、多个接收方和交易明细。在区块链系统中,链上所有参与节点维护一个共同的账本。由于区块链代币去中心化且未实名的特点,需要将区块链地址进行分类,以便识别非法地址。但现有的UTXO区块链地址分类主要是基于规则、经典聚类算法等方法,不能充分挖掘地址之间的复杂内在交易关联。
发明内容
有鉴于此,本发明实施例提供一种区块链地址分类的方法和装置,通过将区块链的账本交易数据构建成异质图网络,不仅能够将海量交易数据的隐式业务规则特点充分表达,挖掘地址之间的复杂内在交易关联,还能够节省内存消耗、提高计算效率。
为实现上述目的,根据本发明实施例的一个方面,提供了一种区块链地址分类的方法,包括:
获取区块链的账本交易数据,根据所述账本交易数据构建异质图网络;
根据所述异质图网络确定待分类地址的表征向量;
将所述待分类地址的表征向量输入预训练的分类模型,确定所述待分类地址的分类结果。
可选地,根据所述账本交易数据构建异质图网络,包括:
将所述账本交易数据对应的所有区块链地址分别作为一个地址顶点,将所述账本交易数据对应的交易标识分别作为一个交易顶点;
对于每条所述交易记录,将所述交易记录的交易标识对应的交易顶点分别与所述交易记录的每个区块链地址对应的地址顶点连接成边,形成所述异质图网络。
可选地,根据所述异质图网络确定所述待分类地址的表征向量,包括:
使用metapath2vec算法在所述异质图网络上进行游走采样,将采样得到的编码序列作为训练数据;
根据已构建的地址标识对应地址的映射词表,对每个待分类地址进行独热编码,得到待分类地址的稀疏矩阵;
根据所述训练数据和所述稀疏矩阵,使用Skip-Gram模型进行模型训练,得到每个所述待分类地址的表征向量。
可选地,使用metapath2vec算法在所述异质图网络上进行游走采样,包括:
使用metapath2vec算法,在所述异质图网络上根据元路径进行游走采样,得到海量不等长的编码序列。
可选地,所述元路径为:任一地址顶点→相连的交易顶点→交易相连的其他地址顶点。
可选地,从区块链的所有地址中筛选多个地址,包括:
根据所述异质图网络确定所述区块链中每个地址对应边的数量,筛选对应边的数量大于等于预设阈值的地址。
可选地,将所述待分类地址的表征向量输入预训练的分类模型之前,还包括:采用XGBoost算法训练所述分类模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民银行数字货币研究所,未经中国人民银行数字货币研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110692274.1/2.html,转载请声明来源钻瓜专利网。