[发明专利]用于生成卷积神经网络的方法和装置在审
申请号: | 201810084926.1 | 申请日: | 2018-01-29 |
公开(公告)号: | CN108288089A | 公开(公告)日: | 2018-07-17 |
发明(设计)人: | 姜志超 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 权重 卷积神经网络 集合 输入值集合 目标卷 积层 量化 方法和装置 取整 预设 初始权重 存储目标 多阶段 响应 申请 | ||
1.一种用于生成卷积神经网络的方法,包括:
获取卷积神经网络的目标卷积层的初始输入值和初始权重;
根据所述初始输入值和所述初始权重,分别生成第一输入值集合和第一权重集合;
根据当前阶段的量化比例,对所述第一输入值集合中的各第一输入值和所述第一权重集合中的各第一权重分别进行量化取整,生成第二输入值集合和第二权重集合,其中,所述第二权重集合中包括量化取整后的第一权重;
将所述第二权重集合作为所述目标卷积层的权重,并确定所述目标卷积层的权重在当前阶段的总量化比例是否达到预设比例值;
响应于确定所述目标卷积层的权重在当前阶段的总量化比例达到预设比例值,将当前阶段的卷积神经网络作为目标卷积神经网络,并存储所述目标卷积神经网络。
2.根据权利要求1所述的方法,其中,所述方法还包括:
响应于确定所述目标卷积层的权重在当前阶段的总量化比例未达到预设比例值,根据损失函数对当前阶段的卷积神经网络进行训练,以调整所述第二权重集合中未量化取整的第一权重,直至损失函数的值趋于目标值;获取下一阶段的量化比例作为当前阶段的量化比例;根据当前阶段的量化比例,对所述第二输入值集合中未量化取整第一输入值和所述第二权重集合中未量化取整的第一权重分别进行量化取整,以更新所述第二输入值集合和所述第二权重集合;将更新的第二权重集合作为所述目标卷积层的权重,并确定所述目标卷积层的权重在当前阶段的总量化比例是否达到所述预设比例值。
3.根据权利要求1所述的方法,其中,所述根据所述初始输入值和所述初始权重,分别生成第一输入值集合和第一权重集合,包括:
根据量化编码的位数,将所述初始输入值的范围和所述初始权重的范围分别均匀划分为预设数目个子区间,其中,所述预设数目与所述量化编码的位数正相关;
根据位于预设数目个子区间中的各输入值和各权重,分别生成第一输入值集合和第一权重集合。
4.根据权利要求3所述的方法,其中,所述对所述第一输入值集合中的各第一输入值和所述第一权重集合中的各第一权重分别进行量化取整,生成第二输入值集合和第二权重集合,包括:
根据预设量化方法,对所述第一输入值集合中的各第一输入值进行量化取整,并将量化取整后的第一输入值作为第二输入值,生成第二输入值集合;
根据所述第一权重集合中的各第一权重的分布概率,对所述第一权重集合中的各第一权重进行上取整或下取整,并将取整后的第一权重作为第二权重,生成第二权重集合。
5.根据权利要求1所述的方法,其中,所述根据所述初始输入值和所述初始权重,分别生成第一输入值集合和第一权重集合,包括:
根据预设的第一数值,将所述初始输入值的范围和所述初始权重的范围划分为预设数目个区间长度不同的子区间;
以所述第一数值为底数,计算各初始输入值的对数,将计算结果作为第一输入值,生成第一输入值集合;
根据位于各子区间的各初始权重,确定区间权重,以作为第一权重,生成第一权重集合。
6.根据权利要求5所述的方法,其中,所述对所述第一输入值集合中的各第一输入值和所述第一权重集合中的各第一权重分别进行量化取整,生成第二输入值集合和第二权重集合,包括:
对所述第一输入值集合中的各第一输入值进行量化取整,并以量化取整后的各第一输入值分别为指数,计算所述第一数值的指数幂,以作为第二输入值,生成第二输入值集合;
根据各子区间的顺序,依次对各第一权重建立序号,生成查询表,并将各第一权重对应的序号作为第二权重,生成第二权重集合,其中,所述序号为整数,且所述查询表中序号与和各第一权重以键值对形式存储。
7.根据权利要求1所述的方法,其中,所述根据当前阶段的量化比例,对所述第一输入值集合中的各第一输入值和所述第一权重集合中的各第一权重分别进行量化取整,包括:
根据当前阶段的量化比例,在所述第一输入值集合和所述第一权重集合中分别选取相应数量的第一输入值和第一权重进行量化取整,其中,所述选取包括按照数值由大到小,从数值大的一端选取,或者按照量化误差由小到大,从误差小的一端选取。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810084926.1/1.html,转载请声明来源钻瓜专利网。