[发明专利]一种基于强化学习实现矩形宏单元的布图规划方法和系统在审
申请号: | 202310493297.9 | 申请日: | 2023-05-05 |
公开(公告)号: | CN116562218A | 公开(公告)日: | 2023-08-08 |
发明(设计)人: | 戴雨洋;张莹;崔钰;陈晨;陈光;曾令仿 | 申请(专利权)人: | 之江实验室 |
主分类号: | G06F30/392 | 分类号: | G06F30/392;G06F17/16;G06N3/0464;G06N3/092 |
代理公司: | 杭州天正专利事务所有限公司 33201 | 代理人: | 王兵;楼明阳 |
地址: | 311121 浙江省杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 强化 学习 实现 矩形 单元 规划 方法 系统 | ||
1.一种基于强化学习实现矩形宏单元的布图规划方法,其特征在于,包含:
S1.根据宏单元、标准单元、网表等信息对宏单元和标准单元进行初始编码,然后根据节点初始编码和网表的图结构进一步得到宏单元的编码;
S2.根据宏单元的面积大小按照降序排列,确定强化学习中智能体摆放宏单元的顺序;
S3.用规则网格将矩形芯片画布划分为若干个矩形区域,同时用矩阵中的每个元素与矩形区域一一对应,获得离散的芯片画布,矩阵中每个元素的值由策略网络决定,该矩阵是智能体的动作空间;
S4.根据动作空间和宏单元的大小和位置信息,用0或1对动作空间再次编码,获得掩模矩阵,然后根据掩模矩阵限制智能体的行动范围;
S5.根据宏单元和标准单元的位置通过虚拟布线,计算总线长、拥塞程度和布局密度;
S6.取总线长、拥塞程度和布局密度的加权和作为强化学习的奖励函数,根据奖励函数用PPO算法训练强化学习模型。
2.根据权利要求1所述的基于强化学习实现矩形宏单元布图规划方法,其特征在于,步骤S1中宏单元和标准单元的编码包含性质、宽、高、引脚数量、与其直接相连的宏单元数量和标准单元数量以及位置。
3.根据权利要求1所述的基于强化学习实现矩形宏单元布图规划方法,其特征在于,步骤S1中采用图卷积神经网络聚合宏单元及其周边节点的信息得到宏单元的编码,并将宏单元的编码作为强化学习的环境特征。
4.根据权利要求1所述的基于强化学习实现矩形宏单元布图规划方法,其特征在于,步骤S2中,将宏单元按照面积从大到小排序,作为强化学习阶段智能体摆放宏单元的顺序。
5.根据权利要求1所述的基于强化学习实现矩形宏单元布图规划方法,其特征在于,步骤S3所述的矩形区域,是离散化后的智能体的动作空间,与动作空间相对应的矩阵是策略网络的输出。
6.根据权利要求1所述的基于强化学习实现矩形宏单元布图规划方法,其特征在于,步骤S4所述的掩模矩阵与策略网络的输出矩阵维数相同。
7.根据权利要求1所述的基于强化学习实现矩形宏单元布图规划方法,其特征在于,步骤S4所述的掩模矩阵根据当前宏单元的宽和高以及已经确定位置的宏单元的大小计算得到,然后与策略网络的输出相结合实现限制智能体行动范围的目的。
8.根据权利要求1所述的基于强化学习实现矩形宏单元布图规划方法,其特征在于,步骤S4所述的掩模矩阵,在当前掩模矩阵下,如果智能体没有合适的摆放区域时,通过扩大掩模矩阵的行数或列数,增加当前宏单元可布局区域,然后,再对扩大后的掩模矩阵用最大池化方法降维,使得掩模矩阵与策略空间的维数保持一致。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于之江实验室,未经之江实验室许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310493297.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:箱体及视频箱
- 下一篇:一种行人跌倒扰动传播仿真方法、存储介质及设备