[发明专利]用于转换到较低精度数据格式的自动方法有效
申请号: | 201810058512.1 | 申请日: | 2018-01-22 |
公开(公告)号: | CN108337000B | 公开(公告)日: | 2021-10-08 |
发明(设计)人: | S·米加茨;浩·吴;D·塞凯拉;U·考帕希;M·米拉科夫;斯朗瓦莫·基拉特;扎基·周;依琳·张;亚历克斯·菲特-弗洛雷亚 | 申请(专利权)人: | 辉达公司 |
主分类号: | H03M7/30 | 分类号: | H03M7/30 |
代理公司: | 北京市磐华律师事务所 11336 | 代理人: | 高伟;娄晓丹 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明的各方面涉及用于执行数据压缩以及在不同程度精度的数据格式之间执行数据转换的计算机实现的技术,并且更具体地,用于使用降低精度的(例如,INT8)数据格式来改进人工神经网络的推理(应用)的计算机实现的技术。本发明的实施方案生成数据输出的候选转换,然后采用相对的质量量度来识别具有最大准确度(例如,与原始较高精度的值具有最小散度)的候选转换。然后,可以在推理过程中使用所述表示法来对所得的输出数据执行计算。 | ||
搜索关键词: | 用于 转换 到较低 精度 数据格式 自动 方法 | ||
【主权项】:
1.一种用于压缩数据的方法,所述方法包括:参考神经网络的层的激活数据;创建激活直方图,所述直方图包括多个仓,其中所述激活数据分布在所述多个仓上;基于所述直方图生成多个候选转换,所述多个候选转换中的每个转换具有不同的饱和度阈值;根据校准数据集确定所述多个候选转换中的每个转换的散度;以及根据参考较高精度分布选择与具有最小散度的转换相对应的饱和度阈值,其中所述多个候选转换以较低精度格式表达,进一步地,其中所述校准数据集和所述激活数据中的至少一个以较高精度格式表达。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于辉达公司,未经辉达公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810058512.1/,转载请声明来源钻瓜专利网。