[发明专利]基于DNA分子加密和LightGBM算法的数字资产交易管理方法及系统有效
| 申请号: | 202111505980.7 | 申请日: | 2021-12-10 |
| 公开(公告)号: | CN113919447B | 公开(公告)日: | 2023-04-14 |
| 发明(设计)人: | 李志杰 | 申请(专利权)人: | 浙江中科华知科技股份有限公司 |
| 主分类号: | G06F18/243 | 分类号: | G06F18/243;G06F18/2415;G06F18/213;G06F18/214;G06F16/35;G06F21/60;G06Q40/04 |
| 代理公司: | 杭州华知专利事务所(普通合伙) 33235 | 代理人: | 张德宝 |
| 地址: | 311121 浙江省杭州市*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 dna 分子 加密 lightgbm 算法 数字 资产 交易 管理 方法 系统 | ||
1.一种基于DNA分子加密和改进的LightGBM算法的数字资产交易管理方法,其特征在于,包括以下步骤:
获取数字资产数据和智能合约数据;
对数字资产数据进行预处理,将预处理后的数据进行情绪分析,生成情绪量化指标纳入新的数据集M;
对智能合约数据提取用户交易特征、字节码特征、操作码特征,并将提取的特征纳入数据集M;
利用数据级重采样技术扩充数据集M得到用于训练的数据集;
利用随机采样和EFB算法对训练数据集进行降维处理;
利用降维处理后的数据训练二分类器模型,利用得到的二分类器模型对待测数据样本进行分类,根据预设的用户特征得到最终的分类结果;
所述二分类器模型输出的分类结果通过DNA加密方法将分类结果进行加密,即采用奇偶交叉位DNA编码,二元序列根据其在序列中的奇偶位置分为两个子序列,分别对两个子序列进行正常的DNA编码;然后,编码的碱基序列被依次拼接和组合,其中,每个二进制位对映射到基数取决于控制参数序列对编码规则的选择C1,其中参数序列的元素C1在整数集{1,...,8}中,混沌整数序列S1是使用x(m,1)空间广义物流系统生成的,S1可以通过以下公式计算,
S1=mod(ceil(x(m,1)1015),8)+1,Ceil(.)将元素四舍五入到最接近无穷大的整数,mod(R,8)返回R除以8的余数;
所述数据级重采样技术包括:欠采样、过采样和SMOTE,其中,在应用欠采样时,通过随机省略一些实例来缩小真实地址的大小,直到数据集平衡;应用过采样时用少数类的一些随机选择的实例的多个副本来补充训练数据集;在应用SMOTE时,通过合成生成的少数类实例来扩充训练数据集;
所述利用随机采样和EFB算法对训练数据集进行降维处理具体为:保留训练数据集中梯度大于预设值的数据并随机采样梯度较小的数据;
将得到的数据通过EFB算法将互斥的数据合并成新的数据;
所述对数字资产数据进行预处理,将预处理后的数据进行情绪分析,生成情绪量化指标纳入新的数据集M具体为:
将获取的数字资产数据进行文本符号清理,然后利用现有的工具库将清理后的数据转为tokens;
将得到的tokens数据中的情绪描述映射为数字资产存储库上的特征值,利用所述特征值生成情绪量化指标并纳入数据集M;
所述情绪量化指标的构建过程为:
构建情绪系数、,具体表示如下:其中,S是由字典得来的情绪值,r控制了系数的上下界,表示消极情绪系数,表示积极情绪系数;将情绪系数标准化,具体计算公式如下:
其中,表示分配给积极词汇的权重,表示分配给消极词汇的权重,表示标准化后的积极情绪系数,表示标准化后的消极情绪系数;
利用标准化后的情绪系数计算得到最终的情绪量化指标、,表达式如下:
其中, 表示积极情绪指标, 表示消极情绪指标;
通过计算待测样本与不同类别用户数据特征的几何中心的距离得到待测样本归属的用户类别,并通过检验给出相对应的置信水平,具体为:设表示k类人群中的第l个样本的n个特征,所述特征包括:平均输入次数、平均接受和发射量、地址的平均活动时间,样本的重心定义为:
其中n表示k类样本的样本数量,对于待测样本W,W将被归类为k,当:
其中,l取遍从1到n时,使得表达式的值最小的l即为k。
2.根据权利要求1所述的一种基于DNA分子加密和改进的LightGBM算法的数字资产交易管理方法,其特征在于,所述用户交易特征包括:转移的平均值、验证所述用户所有交易的平均激励金额、所有交易的奖励平均单价、实际用于交易的奖励平均金额;
所述字节码特征通过提取字节码字符串来获取字节码特征;
所述操作码特征是将每个操作指令出现在合同操作码文件中的次数作为特征进行提取。
3.根据权利要求1所述的一种基于DNA分子加密和改进的LightGBM算法的数字资产交易管理方法,其特征在于,所述预设的用户特征即不同类别的用户特征,用户的类别包括:普通资产用户和疑似数字资产用户,其中普通数字资产用户包括:消费者、长期投资者、短期投资者和早期采用者;所述疑似数字资产用户包括:洗钱者和资产盗取者。
4.一种基于DNA分子加密和改进的LightGBM算法的数字资产交易管理系统,其他特征在于,包括存储器和处理器,所述存储器中包括基于DNA分子加密和改进的LightGBM算法的数字资产交易管理方法程序,所述基于DNA分子加密和改进的LightGBM算法的数字资产交易管理方法程序被所述处理器执行时实现如下步骤:
获取数字资产数据和智能合约数据;
对数字资产数据进行预处理,将预处理后的数据进行情绪分析,生成情绪量化指标纳入新的数据集M;
对智能合约数据提取用户交易特征、字节码特征、操作码特征,并将提取的特征纳入数据集M;
利用数据级重采样技术扩充数据集M得到用于训练的数据集;
利用随机采样和EFB算法对训练数据集进行降维处理;
利用降维处理后的数据训练二分类器模型,利用得到的二分类器模型对待测数据样本进行分类,根据预设的用户特征得到最终的分类结果;
所述二分类器模型输出的分类结果通过DNA加密方法将分类结果进行加密,即采用奇偶交叉位DNA编码,二元序列根据其在序列中的奇偶位置分为两个子序列,分别对两个子序列进行正常的DNA编码;然后,编码的碱基序列被依次拼接和组合,其中,每个二进制位对映射到基数取决于控制参数序列对编码规则的选择C1,其中参数序列的元素C1在整数集{1,...,8}中,混沌整数序列S1是使用x(m,1)空间广义物流系统生成的,S1可以通过以下公式计算,
S1=mod(ceil(x(m,1)1015),8)+1,Ceil(.)将元素四舍五入到最接近无穷大的整数,mod(R,8)返回R除以8的余数;
所述数据级重采样技术包括:欠采样、过采样和SMOTE,其中,在应用欠采样时,通过随机省略一些实例来缩小真实地址的大小,直到数据集平衡;应用过采样时用少数类的一些随机选择的实例的多个副本来补充训练数据集;在应用SMOTE时,通过合成生成的少数类实例来扩充训练数据集;
所述利用随机采样和EFB算法对训练数据集进行降维处理具体为:保留训练数据集中梯度大于预设值的数据并随机采样梯度较小的数据;
将得到的数据通过EFB算法将互斥的数据合并成新的数据;
所述对数字资产数据进行预处理,将预处理后的数据进行情绪分析,生成情绪量化指标纳入新的数据集M具体为:
将获取的数字资产数据进行文本符号清理,然后利用现有的工具库将清理后的数据转为tokens;
将得到的tokens数据中的情绪描述映射为数字资产存储库上的特征值,利用所述特征值生成情绪量化指标并纳入数据集M;
所述情绪量化指标的构建过程为:
构建情绪系数 、,具体表示如下:其中,S是由字典得来的情绪值,r控制了系数的上下界,表示消极情绪系数,表示积极情绪系数;将情绪系数标准化,具体计算公式如下:
其中,表示分配给积极词汇的权重,表示分配给消极词汇的权重,表示标准化后的积极情绪系数,表示标准化后的消极情绪系数;
利用标准化后的情绪系数计算得到最终的情绪量化指标、,表达式如下:
其中, 表示积极情绪指标, 表示消极情绪指标;
通过计算待测样本与不同类别用户数据特征的几何中心的距离得到待测样本归属的用户类别,并通过检验给出相对应的置信水平,具体为:设表示k类人群中的第l个样本的n个特征,所述特征包括:平均输入次数、平均接受和发射量、地址的平均活动时间,样本的重心定义为:
其中n表示k类样本的样本数量,对于待测样本W,W将被归类为k,当:
其中,l取遍从1到n时,使得表达式的值最小的l即为k。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江中科华知科技股份有限公司,未经浙江中科华知科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111505980.7/1.html,转载请声明来源钻瓜专利网。





