[发明专利]执行双输入值绝对值和求和操作的电路有效
申请号: | 201880028582.0 | 申请日: | 2018-01-09 |
公开(公告)号: | CN110574007B | 公开(公告)日: | 2021-07-20 |
发明(设计)人: | A.瓦西尔耶夫;A.梅克思纳;J.R.雷德格雷夫 | 申请(专利权)人: | 谷歌有限责任公司 |
主分类号: | G06F9/30 | 分类号: | G06F9/30;G06F9/38 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 金玉洁 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 执行 输入 绝对值 求和 操作 电路 | ||
描述了一种运行单元。运行单元包括算术逻辑单元(ALU)电路,ALU电路具有用以接收第一值的第一输入端和用以接收第二值的第二输入端。ALU电路包括用以确定第一值的绝对值并将该绝对值加到第二值的电路系统。第一输入端耦合到具有寄存器空间的第一数据路径和运行单元电路的另一ALU的输出端作为第一值的替代源。第二输入端耦合到具有寄存器空间的第二数据路径作为第二值的源。
技术领域
本发明的领域总体上涉及计算科学,更具体地,涉及一种执行双输入值绝对值和求和操作的电路。
背景技术
图像处理通常包含对组织成阵列的像素值的处理。这里,空间组织的二维阵列捕获图像的二维性质(附加尺寸可以包括时间(例如,二维图像序列)和数据类型(例如,颜色))。在通常场景下,成阵列的像素值由生成静止图像或帧序列以捕获运动图像的相机提供。传统的图像处理器通常处于两个极端的任一端。
第一极端作为在通用处理器或通用类处理器(例如,具有矢量指令增强的通用处理器)上运行的软件程序来执行图像处理任务。尽管第一极端通常提供高度通用的应用软件开发平台,但是它对较细粒度数据结构的使用加上相关开销(例如,指令获取和解码、片上和片外数据的处理、推测性运行)最终会导致在程序代码运行期间每单位数据消耗较多的能量。
第二、相对极端将固定功能硬连线电路系统应用于较大的数据块。直接应用于定制设计电路的较大(而不是较细粒度的)数据块的使用大大降低了每单位数据的功耗。然而,使用定制设计的固定功能电路系统一般会导致处理器能够执行的任务集有限。因此,第二极端缺乏广泛通用的编程环境(与第一极端相关联)。
提供高度通用的应用软件开发机会加上提高每单位数据功效的技术平台仍然是一个理想但缺失的解决方案。
发明内容
描述了一种运行单元。运行单元包括算术逻辑单元(arithmetic logic unit,ALU)电路,ALU电路具有用以接收第一值的第一输入端和用以接收第二值的第二输入端。ALU电路包括用以确定第一值的绝对值并将该绝对值加到第二值的电路系统。第一输入端耦合到具有寄存器空间的第一数据路径以及运行单元电路的另一ALU的输出端作为第一值的替代源。第二输入端耦合到具有寄存器空间的第二数据路径作为第二值的源。
附图说明
以下描述和附图用于说明本发明的实施例。在图中:
图1示出了模板处理器的高级视图;
图2涉及块匹配过程;
图3a、图3b、图3c和图3d也涉及块匹配过程;
图4示出了先前的ALU设计;
图5示出了改进的ALU设计;
图6示出了FINDMIN操作;
图7a、图7b、图7c、图7d也示出了FINDMIN操作;
图8示出了修改的计数前导零操作;
图9示出了图像处理器硬件架构的实施例;
图10a、图10b、图10c、图10d和图10e描绘了将图像数据解析成线组、将线组解析成薄片(sheet)以及在具有重叠模板的薄片上执行的操作;
图11a示出了模板处理器的实施例;
图11b示出模板处理器的指令字的实施例;
图12示出模板处理器内的数据计算单元的实施例;
图13a、图13b、图13c、图13d、图13e、图13f、图13g、图13h、图13i、图13j和图13k描绘了使用二维移位阵列和运行通道阵列来确定具有重叠模板的一对相邻输出像素值的示例;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880028582.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于自动同步设备上响应与条件的系统和方法
- 下一篇:ID空间变换系统及其方法