大家好,又见面了,我是你们的朋友全栈君。
双线性插值法
定义: 又称双线性内插。在数学上,双线性插值是有两个变量的插值函数的线性插值扩展,其核心思想是在两个方向上分别进行一次线性插值。 对于一个目的像素,设置坐标通过反向变换得到的浮点坐标为(i u,j v) (其中i、j均为浮点坐标的整数部分,u、v为浮点坐标的小数部分,是取值[0,1)区间的浮点数),则这个像素得值 f(i u,j v) 可由原图像中坐标为 (i,j)、(i 1,j)、(i,j 1)、(i 1,j 1)所对应的周围四个像素的值决定,即:f(i u,j v) = (1-u)(1-v)f(i,j) (1-u)vf(i,j 1) u(1-v)f(i 1,j) uvf(i 1,j 1) 其中f(i,j)表示源图像(i,j)处的的像素值,以此类推。
特点: 当对相邻四个像素点采用双线性插值时,所得表面在邻域处是吻合的,但斜率不吻合。并且双线性灰度插值的平滑作用可能使得图像的细节产生退化,这种现象在进行图像放大时尤其明显。
计算: 已知的红色数据点与待插值得到的绿色数据点
假如我们想得到未知函数f在点P= (x,y) 的值,假设我们已知函数f在Q11 = (x1,y1)、Q12 = (x1,y2),Q21 = (x2,y1) 以及Q22 = (x2,y2) 四个点的值。
首先在x方向进行线性插值,得到R1和R2,然后在y方向进行线性插值,得到P。
这样就得到所要的结果f(x,y).
其中红色点Q11,Q12,Q21,Q22为已知的4个像素点.
第一步:X方向的线性插值,在Q12,Q22中插入蓝色点R2,Q11,Q21中插入蓝色点R1;
第二步 :Y方向的线性插值 ,通过第一步计算出的R1与R2在y方向上插值计算出P点。
线性插值的结果与插值的顺序无关
。首先进行y方向的插值,然后进行x方向的插值,所得到的结果是一样的。
在图像处理的时候,我们先根据
代码语言:javascript复制srcX = dstX * (srcWidth / dstWidth);
srcY = dstY * (srcHeight / dstHeight);
来计算目标像素在源图像中的位置,这里计算的srcX和srcY一般都是浮点数,比如f(1.2, 3.4)这个像素点是虚拟存在的,先找到与它临近的四个实际存在的像素点 (1, 3) (2, 3) (1, 4) (2, 4) 写成f(i u, j v)的形式,则u = 0.2, v = 0.4, i = 1, j = 3 在沿着X方向差插值时,f(R1)=u(f(Q21)-f(Q11)) f(Q11) 沿着Y方向同理计算。 或者,直接整理一步计算,f(i u,j v) = (1-u)(1-v)f(i,j) (1-u)vf(i,j 1) u(1-v)f(i 1,j) uvf(i 1,j 1) 。
如果选择一个坐标系统使得 的四个已知点坐标分别为 (0, 0)、(0, 1)、(1, 0) 和 (1, 1),那么插值公式就可以化简为
代码语言:javascript复制f(x,y)=f(0,0)(1-x)(1-y) f(1,0)x(1-y) f(0,1)(1-x)y f(1,1)xy
在x与y方向上,z值成单调性特性的应用中,此种方法可以做外插运算,即可以求解Q1~Q4所构成的正方形以外的点的值。
//—————————以下摘自:Mr. Easy
加速及优化
单纯按照上文实现的插值算法只能勉强完成插值的功能,速度和效果都不会理想,在具体代码实现的时候有些小技巧。参考OpenCV源码以及网上博客整理如下两点:
•源图像和目标图像几何中心的对齐。
•将浮点运算转换成整数运算
1)源图像与目标图像几何中心的对齐
方法:在计算源图像的虚拟浮点坐标的时候,一般情况:
srcX=dstX* (srcWidth/dstWidth) ,
srcY = dstY * (srcHeight/dstHeight)
中心对齐(OpenCV也是如此):
SrcX=(dstX 0.5)* (srcWidth/dstWidth) -0.5
SrcY=(dstY 0.5) * (srcHeight/dstHeight)-0.5
原理
双线性插值算法及需要注意事项这篇博客解释说“如果选择右上角为原点(0,0),那么最右边和最下边的像素实际上并没有参与计算,而且目标图像的每个像素点计算出的灰度值也相对于源图像偏左偏上。”我有点保持疑问。
将公式变形,srcX=dstX* (srcWidth/dstWidth) 0.5*(srcWidth/dstWidth-1)
相当于我们在原始的浮点坐标上加上了0.5*(srcWidth/dstWidth-1)这样一个控制因子,这项的符号可正可负,与srcWidth/dstWidth的比值也就是当前插值是扩大还是缩小图像有关,有什么作用呢?看一个例子:假设源图像是3*3,中心点坐标(1,1)目标图像是9*9,中心点坐标(4,4),我们在进行插值映射的时候,尽可能希望均匀的用到源图像的像素信息,最直观的就是(4,4)映射到(1,1)现在直接计算srcX=4*3/9=1.3333!=1,也就是我们在插值的时候所利用的像素集中在图像的右下方,而不是均匀分布整个图像。现在考虑中心点对齐,srcX=(4 0.5)*3/9-0.5=1,刚好满足我们的要求.
将浮点运算转换成整数运算
参考图像处理界双线性插值算法的优化
直接进行计算的话,由于计算的srcX和srcY 都是浮点数,后续会进行大量的乘法,而图像数据量又大,速度不会理想,解决思路是:浮点运算→→整数运算→→”<<左右移按位运算”
。
放大的主要对象是u,v这些浮点数,OpenCV选择的放大倍数是2048“如何取这个合适的放大倍数呢,要从三个方面考虑,第一:精度问题,如果这个数取得过小,那么经过计算后可能会导致结果出现较大的误差。第二,这个数不能太大,太大会导致计算过程超过长整形所能表达的范围。第三:速度考虑。假如放大倍数取为12,那么算式在最后的结果中应该需要除以12*12=144,但是如果取为16,则最后的除数为16*16=256,这个数字好,我们可以用右移来实现,而右移要比普通的整除快多了。”我们利用左移11位操作就可以达到放大目的。
代码:
代码语言:javascript复制//双线性内插
uchar* dataDst = matDst1.data;
int stepDst = matDst1.step;
uchar* dataSrc = matSrc.data;
int stepSrc = matSrc.step;
int iWidthSrc = matSrc.cols;
int iHiehgtSrc = matSrc.rows;
for (int j = 0; j < matDst1.rows; j)
{
float fy = (float)((j 0.5) * scale_y - 0.5);
int sy = cvFloor(fy);
fy -= sy;
sy = std::min(sy, iHiehgtSrc - 2);
sy = std::max(0, sy);
short cbufy[2];
cbufy[0] = cv::saturate_cast<short>((1.f - fy) * 2048);
cbufy[1] = 2048 - cbufy[0];
for (int i = 0; i < matDst1.cols; i)
{
float fx = (float)((i 0.5) * scale_x - 0.5);
int sx = cvFloor(fx);
fx -= sx;
if (sx < 0) {
fx = 0, sx = 0;
}
if (sx >= iWidthSrc - 1) {
fx = 0, sx = iWidthSrc - 2;
}
short cbufx[2];
cbufx[0] = cv::saturate_cast<short>((1.f - fx) * 2048);
cbufx[1] = 2048 - cbufx[0];
for (int k = 0; k < matSrc.channels(); k)
{
*(dataDst j*stepDst 3*i k) = (*(dataSrc sy*stepSrc 3*sx k) * cbufx[0] * cbufy[0]
*(dataSrc (sy 1)*stepSrc 3*sx k) * cbufx[0] * cbufy[1]
*(dataSrc sy*stepSrc 3*(sx 1) k) * cbufx[1] * cbufy[0]
*(dataSrc (sy 1)*stepSrc 3*(sx 1) k) * cbufx[1] * cbufy[1]) >> 22;
}
}
}
cv::imwrite("linear_1.jpg", matDst1);
cv::resize(matSrc, matDst2, matDst1.size(), 0, 0, 1);
cv::imwrite("linear_2.jpg", matDst2);
【参考:】
- https://baike.baidu.com/item/双线性插值/11055945?fr=aladdin
- http://www.cnblogs.com/yssongest/p/5303151.html
- http://handspeaker.iteye.com/blog/1545126
发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/132918.html原文链接:https://javaforall.cn