首先将东京工业大学新提出的基于Residual difference interpolation的几篇文章扫一遍,这是第一篇,提出residual difference rather than color difference
网站
idea

左边为正常的Demosaicking流程是:先fine-grained地对G通道插值,然后对R通道插值的时候,是根据R-G的谱间具有相似差异性的原理进行,得到delta,在插值过程中得到R图再把delta加上的过程。
现在RI提出直接使用G图做差值插值由于变换太过剧烈的地方会造成Artifact,如今用一些处理使得这个G变成G尖,这个G尖的图像满足平滑和准确的特性。如此利用这个谱间相关性的时候误差会更小,出来的效果更好。
具体内容
提出了Residual Interpolation基于GBTF的Demosaick初始化,这里用的是GBTF做G通道的初始化插值,然后Guided Filter得到G尖。我们来看看这两个论文。
GBTF
喔,这篇文章是基于我老板的DLMMSE文章优化,简要说一下老板的思路:先求出G-R和G-B图像在横竖方向上的differences,然后建立一个噪声估计模型,结合了optimal LMMSE的方法,直接将performance比以前提高了5个dp。(我老板就说那些人全都是瞎搞的。)这里GBTF提了DLMMSE两点缺陷:1.只利用了4-Neighbor的像素 2.将原来的两个方向解耦成四个方向 3.利用了较好的sparse adaptive初始化方法
实验的结论比LPA好0.14dB,比DLMMSE好0.64dB(基本上小打小闹的trick).

在DLMMSE基础上,对G的插值使用了Gradient Weighted Based的方法,对R和B的通道使用了[3]的sparse adaptive interpolation(一定程度可以通道稀疏来抑制噪声,有空看看这篇什么鬼)。
MMSE
首先说一下这个优化方法,MMSE指Minimum Mean Square Error。问了一下师兄,懂了不少。
这个是一个知道函数形式,拟合参数的模型,y为Ground Truth,$\hat x(y)$ of x is any function of y. Model一个$MSE=tr{E{(\hat x-x)(\hat x=x)^T}}$ 则有$$\hat x_{MMSE}(y) = arg min_{\hat x}MSE$$
这个模型假定你知道了x与y的函数形式,用最小化MSE的方法求解函数的具体参数。
传统的做法是假设函数形式,然后用Monte Carlo或者Gradient Descent去寻找最优解,但这样仍然需要评价指标。所以简单来说,一般用线性的模型可以变成Optimal LMMSE的问题。 $$min_{W,b}MSE \ \ s.t. \hat x = Wy+b$$
Optimal b and W is given by: $b = \overline x - W \overline y, W = C_{XY}C_Y^{-1}$ 然后用样本集的统计值来求解。
DLMMSE
这里老板借鉴了LMMSE即Linear MMSE的方法,来拟合PSD(pirmer signal difference)和LCC1初始化后的Vertical和Horizontal的噪声。这里有点复杂:首先理解了Demosaicking里面的Color Difference原理是利用了局部区域谱间差值为常量,这个协同性原理。然而这个差值为常量的假设并不准确,所以很多人在这个问题上面做文章。我们发现,有时候出现Artifact是因为变化过于剧烈,这里面已经超过了信号的采样原理,所以信息是丢失无法恢复的。我们只能加入一些约束和先验知识来弥补(后面扩展的工作)。所以这个PSD就是Color Difference并不准确,我们来拟合它。这里直接使用一个LCC1作为G通道插值的初始化,然后简单计算V和H方向上的梯度,与PSD相减得到误差$\epsilon$ 。
到这里,我们可以建模了,n代表位置,将x代表PSD,y代表我们拟合真正的结果,$\epsilon$就是初始化方法的误差。$$y(n) = x(n) + v(n)$$
引入MMSE模型来求解拟合真正的x,y为数据观测值,传统MMSE未定形式不好求解,所以使用LMMSE,得到$\hat x = E[x] + \frac{Conv(x,y)}{Var(y)(y-E[y])}$,自然地假设x和v是为locally Gaussian processes,而且经验性地发现demosaicking noise $\epsilon_{g,r}^h$ 和 $\epsilon_{g,r}^v$为zero-mean random process,且uncorrelated with $\Delta_{g,r}$ (经过实验测出的,数值在0~0.08之间)所以可以简化式子为$$\hat x = \mu_x + \frac{\sigma_x^2}{(\sigma_x^2+\sigma_v^2)}(y-\mu_x)$$ 这里不用计算x的后验和真正样本的均值,因为基于上述假设,可以用x的期望代替了。Cov(x,y)用Cov(x)替代了。这样,我们就拟合预测出优化的PSD $\hat x$,用这个来拟合通道之间的信息更有效!
总结: LMMSE就是提出y和x的线性关系,然后根据最小MSE去根据观测样本的分布来拟合出符合分布的观测值$\hat x$,关键是用数据样本拟合出线性模型的参数,然后新来的样本经过模型得到拟合的值,会比原来观测的值更符合样本分布。(假设观测样本和预测样本是同分布的)
看了源码:可以看到在实现里面,先对图像做了横向和纵向的滤波,然后在8*8的patch里面进行LMMSE的求解拟合的。
RI
回到RI,想法也是拟合一个better PSD,只是这里的做法是用一个比较好的初始化方法,GBTF,在这个之上用了何大神的Guided Filter做平滑上采样(文中这么说),然后得到一个比较好的tentative estimate,用这个来拟合channel difference,取得了更好的效果,接下来就看一下这个guided filter和RI延伸出来的Improvement工作。
RI在IMAX和Kodak的30张Images取得CPSNR 37.92dB
参考:
[1]I. Pekkucuksen and Y. Altunbasak, “Gradient based threshold free color filter array interpolation,” Proc. of IEEE Int. Conf. on Image Processing (ICIP), pp. 137– 140, 2010.
[2]Zhang, L. and X. Wu (2005). “Color demosaicking via directional linear minimum mean square-error estimation.” Image Processing, IEEE Transactions on 14(12): 2167-2178.
[3] D. Paliy, V. Katkovnik, R. Bilcu, S. Alenius, and K. Egiazarian, “Spatially adaptive color filter array interpo- lation for noiseless and noisy data,” International Journal of Imaging Systems and Technology, vol. 17, no. 3, pp. 105-122, 2007.