[发明专利]一种加速双线性插值计算的方法有效

申请号：	201610479164.6	申请日：	2016-06-22
公开（公告）号：	CN107527320B	公开（公告）日：	2020-06-02
发明（设计）人：	朱旭光;刘宇	申请（专利权）人：	南京视察者图像识别科技有限公司
主分类号：	G06T3/40	分类号：	G06T3/40
代理公司：	暂无信息	代理人：	暂无信息
地址：	210001 江苏省南京市秦淮区永智路6***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种加速双线性插值计算方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种加速双线性插值计算的方法，其特征在于包括以下步骤为：

(1)_mm_loadl_epi64指令导入加载两对像素P12和P34，P12为像素P1和P2，P34为像素P3和P4；

(2)计算周边四个像素的权重W1,W2,W3,W4,_mm_mul_ps指令将权重W乘以256,_mm_cvtps_epi32指令将W转化成整数,_mm_packs_epi32指令将32位数据扩展转化成16位数据，W＝{W1,W2,W3,W4}；

(3)由_mm_unpacklo_epi8、_mm_unpackhi_epi64指令具体重组数据类型：将[RGBARGBARGBAGRBA]转成[RRRRGGGGBBBBAAAA]数据，即AoS类型转成SoA类型；

(4)_mm_unpacklo_epi8指令获取低位数据并转成16位，得到数据pRG，_mm_unpackhi_epi8指令获取高位数据并转成16位，得到数据pBA；

(5)_mm_madd_epi16指令将权重W分别和pRG、pBA进行运算得到outRG、outBA；

(6)_mm_hadd_epi32指令将outRG、outBA水平相加；

(7)_mm_packus_epi32、_mm_packus_epi16、_mm_cvtsi128_si32指令将最终数据转成一个32位整数，该32位整数即为目标像素RGBA值，计算完成；

所述计算周边四个像素的权重为：通过SSE指令计算周边四个像素的权重，具体如下

(21)_mm_set_ss指令加载浮点坐标(x,y)，_mm_unpacklo_ps指令交叉打包x和y；

(22)_m_floor_ps指令计算x和y的整数部分ix和iy，_mm_sub_ps指令计算坐标小数部分fx和fy；

(23)_mm_sub_ps、_mm_unpacklo_ps、_mm_movelh_ps、_mm_shuffle_ps指令计算Wx＝[1-fx,fx,1-fx,fx]和Wy＝[1-fy,1-fy,fy,fy]；

(24)_mm_mul_ps指令计算Wx*Wy,即得到W1,W2,W3,W4这4个权重值：(1-fx)*(1-fy)，fx*(1-fy)，(1-fx)*fy，fx*fy，权重计算完成并返回值。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于南京视察者图像识别科技有限公司，未经南京视察者图像识别科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201610479164.6/1.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载