[发明专利]一种函数中数据处理方法、装置、设备及存储介质在审
申请号: | 201910726018.2 | 申请日: | 2019-08-07 |
公开(公告)号: | CN112346782A | 公开(公告)日: | 2021-02-09 |
发明(设计)人: | 张亚霏 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F9/30 | 分类号: | G06F9/30;G06F9/38;G06N3/063;G06N3/04 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫;贾允 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 函数 数据处理 方法 装置 设备 存储 介质 | ||
本申请公开了一种函数中数据处理方法、装置、设备及存储介质,所述方法包括:确定输入目标函数中向量;基于所述向量中单个元素的位数以及单指令多数据流的单次处理数据位数,确定所述单指令多数据流单次处理的元素个数;基于所述向量中元素的个数以及所述单指令多数据流单次处理的元素个数,确定所述向量中第一元素集和第二元素集;所述第一元素集中元素个数之和与所述单指令多数据流单次处理的元素个数的比值为正整数;基于所述单指令多数据流对所述第一元素集进行处理;基于单指令单数据流对所述第二元素集进行处理。采用本申请的技术方案,提高了元素中数据的处理效率,从而提高了函数的运算速度。
技术领域
本申请涉及数据处理技术领域,尤其涉及一种函数中数据处理方法、装置、设备及存储介质。
背景技术
RELU函数是深度学习中的一个核心函数,它的速度是至关重要的。目前,现有技术中已知的RELU函数均使用单指令单数据流(Single Instruction Single Data,SISD)指令来实现。SISD指令一次处理输入向量中的一个元素,直到向量中所有元素被处理完。
基于SISD指令的RELU函数计算速度慢,当RELU函数在关键领域执行时,比如看一看的在线服务中,更慢的速度意味着更大的延时,更多的超时失败,更差的用户体验。
因此,有必要提供一种可以提高函数运算速度的数据处理方法、装置、设备及存储介质。
发明内容
本申请提供了一种函数中数据处理方法、装置、设备及存储介质,可以提高元素中数据的处理效率,从而提高函数的运算速度,提升用户体验。
一方面,本申请提供了一种函数中数据处理方法,所述方法包括:
确定输入目标函数中向量;
基于所述向量中单个元素的位数以及单指令多数据流的单次处理数据位数,确定所述单指令多数据流单次处理的元素个数;
基于所述向量中元素的个数以及所述单指令多数据流单次处理的元素个数,确定所述向量中第一元素集和第二元素集;所述第一元素集中元素个数之和与所述单指令多数据流单次处理的元素个数的比值为正整数,所述第二元素集为所述向量中除所述第一元素集之外的元素的集合;
基于所述单指令多数据流对所述第一元素集进行处理;
基于单指令单数据流对所述第二元素集进行处理。
另一方面提供了一种函数中数据处理装置,所述装置包括:
向量确定模块,用于确定输入目标函数中向量;
单次处理元素个数确定模块,用于基于所述向量中单个元素的位数以及单指令多数据流的单次处理数据位数,确定所述单指令多数据流单次处理的元素个数;
元素集确定模块,用于基于所述向量中元素的个数以及所述单指令多数据流单次处理的元素个数,确定所述向量中第一元素集和第二元素集;所述第一元素集中元素个数之和与所述单指令多数据流单次处理的元素个数的比值为正整数,所述第二元素集为所述向量中除所述第一元素集之外的元素的集合;
第一元素集处理模块,用于基于所述单指令多数据流对所述第一元素集进行处理;
第二元素集处理模块,用于基于单指令单数据流对所述第二元素集进行处理。
另一方面提供了一种函数中数据处理设备,所述设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上所述的函数中数据处理方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910726018.2/2.html,转载请声明来源钻瓜专利网。