[发明专利]基于时延和事务吞吐量的区块链共识任务卸载方法及装置有效
| 申请号: | 202011359457.3 | 申请日: | 2020-11-27 |
| 公开(公告)号: | CN112579194B | 公开(公告)日: | 2023-04-07 |
| 发明(设计)人: | 安致嫄;徐思雅;舒新建;吴利杰;郭少勇;刘岩;王雷;秦晓阳;廖博娴;王春迎;王得全 | 申请(专利权)人: | 国网河南省电力公司信息通信公司;北京邮电大学;国家电网有限公司 |
| 主分类号: | G06F9/445 | 分类号: | G06F9/445;G06F16/27 |
| 代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 项京;丁芸 |
| 地址: | 450052 河南*** | 国省代码: | 河南;41 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 事务 吞吐量 区块 共识 任务 卸载 方法 装置 | ||
1.一种基于时延和事务吞吐量的区块链共识任务卸载方法,其特征在于,应用于区块链系统中的第一移动设备,所述区块链系统中还包括:多个移动边缘计算MEC服务器和多个第二移动设备,其中,所述第一移动设备为用于生成区块数据的移动设备;所述方法包括:
获取区块链共识任务;所述区块链共识任务为将目标交易数据写入区块,以及验证区块数据的真实性所产生的任务;
基于预设的马尔可夫决策过程MDP,获得当前时刻的当前信道条件、各个MEC服务器的当前可用计算资源和各个第二移动设备的当前信任值,作为当前马尔可夫状态;所述MDP中包括:预设的状态空间,预设的奖励函数以及预设的动作空间,其中状态空间包括:信道条件、MEC服务器的可用计算资源和各个第二移动设备的信任值,所述动作空间包括:卸载决策、传输功率分配、区块大小以及区块间隔时间;所述奖励函数为预先基于卸载的区块链共识任务处理时延最小化和第一移动设备事务吞吐量最大化的原则设置的;
将所述当前马尔可夫状态,输入预设的异步的优势行动者评论家算法A3C模型中,以使该A3C模型基于所述奖励函数计算奖励,基于所述奖励获得并输出与所述当前马尔可夫状态对应的目标动作,所述目标动作包括目标卸载规则、目标传输功率分配、目标区块大小以及目标区块间隔时间;
当所述目标卸载规则为不对区块链共识任务进行卸载时,对所述区块链共识任务进行处理,获得第一处理结果;
当所述目标卸载规则为将区块链共识任务卸载至MEC服务器时,将所述区块链共识任务发送至所述MEC服务器,以使所述MEC服务器接收所述区块链共识任务,并对所述区块链共识任务进行处理,获得第二处理结果,并将所述第二处理结果返回至所述第一移动设备;所述第一移动设备接收所述MEC服务器返回的第二处理结果;
当所述目标卸载规则为将区块链共识任务卸载至多个第二移动设备时,将所述区块链共识任务拆分为预设数量的子任务发送至多个第二移动设备;以使多个所述第二移动设备接收第一移动设备发送的子任务,进行处理,获得子任务处理结果返回给第一移动设备;
接收多个第二移动设备返回的多个子任务处理结果,生成第三处理结果。
2.根据权利要求1所述的方法,其特征在于,所述MDP中还包括:动作与状态之间的转移关系;
所述将所述当前马尔可夫状态,输入预设的异步的优势行动者评论家算法A3C模型中,以使该A3C模型基于所述奖励函数计算奖励,基于所述奖励获得并输出与所述当前马尔可夫状态对应的目标动作的步骤,包括:
将所述当前马尔可夫状态输入所述A3C模型中;
将所述A3C模型中的初始模型参数设置为当前模型参数;
将所述当前马尔可夫状态作为A3C当前状态;
基于所述A3C当前状态、所述当前模型参数及预设的策略函数,执行当前动作,所述当前动作中包括:当前卸载规则、当前传输功率分配、当前区块大小以及当前区块间隔时间;
根据所述当前动作中的当前卸载规则、当前传输功率分配、当前区块大小、当前区块间隔时间以及所述奖励函数,获得当前奖励;
基于所述A3C当前状态,所述当前动作以及所述动作与状态之间的转移关系,获得下一个A3C状态;
根据所述当前奖励是否满足预设奖励条件,判断所述下一个A3C状态是否为A3C终止状态,以及判断执行当前动作的次数是否满足预设执行动作次数阈值;
若所述下一个A3C状态不是A3C终止状态,且执行当前动作的次数未满足预设执行动作次数阈值,则将所述下一个A3C状态作为A3C当前状态,返回所述基于所述A3C当前状态、所述当前模型参数及预设的策略函数,执行当前动作的步骤;
若所述下一个A3C状态是A3C终止状态,或执行当前动作的次数满足预设执行动作次数阈值,则基于各所述A3C状态对应的奖励和预设的优势函数计算公式,计算各所述A3C状态对应的优势函数值;
从各所述A3C状态对应的优势函数值中选择最大值,作为目标优势函数值;
利用预设的损失函数计算公式,以及所述目标优势函数值,计算损失函数值;
利用预设的累积梯度计算公式,以及所述损失函数值,计算累积梯度;
利用所述累积梯度更新所述当前模型参数;
判断当前迭代次数是否大于或等于预设迭代次数阈值,若是,则所述A3C模型收敛,输出最后一个A3C状态对应的目标动作,若否,则返回所述将所述当前马尔可夫状态作为A3C当前状态的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网河南省电力公司信息通信公司;北京邮电大学;国家电网有限公司,未经国网河南省电力公司信息通信公司;北京邮电大学;国家电网有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011359457.3/1.html,转载请声明来源钻瓜专利网。





