插值在图像中的应用一般为处理图像的缩放。所谓缩放就是缩小和放大。在所有插值缩放算法中要数最邻近插值最简单最暴力,当然效果也是最不好的。经过该算法进行放大的图片会出现马赛克现象,而进行缩小的图片也会丢失较大的图像信息。但是由于其简单,也是介绍该类算法不可不了解的。接下来首先介绍它。
- 最临近插值
在介绍该算法之前,我们先介绍下计算机中图像的知识。一般我们数字处理的图像都为像素图,即位图。对于一张位图而言,我们一般会给其一套坐标系。横轴x和纵轴y。而坐标原点我们一般选取图像的左上角。所以图像上的每个像素都有他们自己的坐标。因为是数字图像,其坐标值也是离散的。(0, 0)代表原点,(0, 1)代表第一行第二列的像素点。
知道了以上的图像知识后,我们就可以来介绍算法本身了。以放大为例。假设我们现在有一张 5 x 5 大小的图片,要把它放大成 10 x 10 大小的图片。那么我们生成一个 10 x 10 大小的图像。然后对于每个像素点我们按照一定的方法给它赋上相应的像素值,那么就完成了放大。而最临近插值就是根据生成图的坐标 (x,y)计算得到原图上的对应坐标(x/(10/5),y/(10/5))。然后取原图上该点的像素点值赋值给生成图。当然,前面的对应坐标计算中可能出现小数的情况,这时候我们可以用四舍五入或者向下或向上取整的方法来获得对应的原图坐标。正因为这个机制的引入,才导致最后的生成图效果不佳。
下面我给出一段自己写的 python 的代码,可以快速的理解算法的原理:
def resize(src_data, dst_height, dst_width):
ori_height, ori_width, channel = src_data.shape
ratio_height = ori_height / dst_height
ratio_width = ori_width / dst_width
dst_data = np.zeros((dst_height, dst_width, channel), np.uint8)
for i in range(channel):
for y in range(dst_height):
for x in range(dst_width):
x_ori = int(x * ratio_width)
y_ori = int(y * ratio_height)
dst_data[y, x, i] = src_data[y_ori, x_ori, i]
return dst_data
其中,src_data 为原图片数据,dst_height 和 dst_width 是我们想要 resize 后的高和宽。返回我们要的图像数据。下面是该算法的结果图:(原图为 960 * 1440。分别缩小为 200 * 500 以及放大为 1200 * 2500。)
原图.png 放大图.png 缩小图.png
- 双向性插值
介绍双向性插值之前,我们有必要知道下线性插值的知识。
顾名思义,双线性插值就是使用两次线性插值来获取未知点的值。在数学上,双线性插值是对线性插值在二位网络中的延伸。
如图,假如我们想得到未知函数 f 在点 P=(x,y)的值,假设我们已知函数 f 在 Q11=(x1,y1), Q12=(x1,y2), Q21=(x2,y1), 及 Q22=(x2,y2) 四个点的值。
插值图.png
首先在 x 方向进行线性插值,得到
f(x,y1) ≈ (x2−x / x2−x1) * f(Q11) + (x−x1 / x2−x1) * f(Q21), f(x,y2) ≈ (x2−x / x2−x1) * f(Q12) + (x−x1 / x2−x1) * f(Q22).
然后在 y 方向进行线性插值,得到
f(x,y) ≈ (y2−y / y2−y1) * f(x,y1) + (y−y1 / y2−y1) * f(x,y2)。带入上面的式子并整理可得到:
式子.png
当然在图像中的应用,我们可以知道公共分母 (x2 - x1)(y2 - y1) 是 1 * 1 为 1。因此,上面的公式就简化为: (x2 - x)(y2 - y) * f(Q11) + (x - x1)(y2 - y) * f(Q21) + (x2 - x)(y - y1) * f(Q12) + (x - x1)(y - y1) * f(Q22)。这也就是双线性插值在图像传统算法中的应用。
网友评论