opencv筆記4：模闆運算和常見濾波操作

這一篇主要是學習模闆運算，了解各種模闆運算的運算過程和分類，理論方面主要參考《圖像工程——圖像處理》（章毓晉）一書第3章，空域增強：模闆操作。同時也有個疑問：此書第四章，頻域圖像增強，講了低通濾波和高通濾波，然而這些東西和模闆運算中的平滑、銳化操作有什麼差別？。。。

以下是正文：

首先我們把所有圖像看作矩陣。

模闆一般是nxn（n通常是3、5、7、9等很小的奇數）的矩陣。模闆運算基本思路：将原圖像中某個像素的值，作為它本身灰階值和其相鄰像素灰階值的函數。模闆中有一個錨點（anchor point），通常是矩陣中心點，和原圖像中待計算點對應；整個模闆對應的區域，就是原圖像中像素點的相鄰區域。模闆也稱為核（kernel）。

前面的解釋翻譯成公式就是：

常見的function操作有卷積和排序兩種。卷積可以立即為一個map-reduce過程：元素對應相乘（mapper），乘積累加（reducer）。顯然，卷積是一個線性操作。

排序操作也不難了解：模闆的錨點和待計算點綁定後，鄰域内所有點進行排序操作，将排序結果中符合政策規定的作為結果。一般的排序算法是O(n log n)的，不知道是不是是以有人認為模闆排序運算不是線性的。其實通常處理的圖像像像素值都是unsigned char類型的，是[0,255]之間的非負整數，顯然用桶排序是可以O(n)複雜度内完成排序的，依我看也是一種線性運算。

如果模闆排序前，需要對應元素和模闆元素相乘，然後将乘積排序，那麼這時候乘積可能是浮點數，排序就基本上是O(n log n)了，這确實是非線性操作了。不過目前我沒有見到類似的操作，也覺得沒有什麼實際的用處。

模闆運算的效果，可能讓圖像變好，也可能讓圖像變壞。我們當然需要好的那種模闆運算了：）利用像素本身及其鄰域像素的灰階關系進行增強的方法，被稱為濾波，濾波使用到的模闆就是濾波器。（注意：濾波器是一個模闆矩陣，也就是核kernel，而具體的卷積操作還是排序操作，不是濾波器）

卷積是濾波的一種實作方式。卷積是一種具體的運算，雖然它其實也是有點一種抽象的表述；而濾波則是比卷積要抽象的描述。

先看看頻率的本意：(狹義概念)頻率是機關時間内完成周期性變化的次數。推廣開來，（廣義概念）頻率就是指一定時間内的變化次數。

頻率在信号處理領域大量使用。信号進行中的函數自變量是時間；數字圖像處理被看作類似信号處理，隻不過這裡的函數自變量不再是時間，而是換成了圖像矩陣的像素灰階值。

原來在信号進行中，從前一秒到後一秒，信号周期性變化的次數，就是頻率；相應地，在數字圖像進行中，從一個像素點到相鄰的一個像素點，灰階值變化的多少，就是頻率。

所謂高頻分量，就是頻率值高，就是像素之間灰階變化大，這通常對應着圖像區域邊緣等；而低頻分量，就是頻率值低，就是像素灰階之間灰階變化小，這通常是圖像中穩定的區域，是在一個object的内部，同屬于一個superpixel...

總之，這樣的了解下，高頻分量對應圖像邊緣等像素變化大的像素點；低頻分量對應着圖像中穩定的區域。

平滑濾波能去除高頻分量，而銳化濾波能去除低頻分量。這麼說還是抽象，具體講是：平滑濾波去處噪聲，銳化濾波強化邊緣、細節與周圍的對比度。

平滑濾波主要包括：線性平滑濾波（方框濾波、均值濾波、高斯濾波等）、非線性平滑濾波（中值濾波、序統計濾波）。opencv中對應boxblur、blur、gaussianblur函數。

銳化濾波主要包括：線性銳化濾波（拉普拉斯算子、高頻提升濾波）、非線性銳化濾波（基于梯度的銳化濾波、最大-最小銳化變換等）

注意實際上對圖像進行二維傅立葉變換得到頻譜圖，就是圖像梯度的分布圖，當然頻譜圖上的各點與圖像上各點并不存在一一對應的關系，即使在不移頻的情況下也是沒有。傅立葉頻譜圖上我們看到的明暗不一的亮點，實際上圖像上某一點與鄰域點差異的強弱，即梯度的大小，也即該點的頻率的大小（可以這麼了解，圖像中的低頻部分指低梯度的點，高頻部分相反）。一般來講，梯度大則該點的亮度強，否則該點亮度弱。這樣通過觀察傅立葉變換後的頻譜圖，也叫功率圖，我們首先就可以看出，圖像的能量分布，如果頻譜圖中暗的點數更多，那麼實際圖像是比較柔和的（因為各點與鄰域差異都不大，梯度相對較小），反之，如果頻譜圖中亮的點數多，那麼實際圖像一定是尖銳的，邊界分明且邊界兩邊像素差異較大的。

opencv現在有3個線性平滑濾波器：方框濾波、均值濾波、高斯濾波

先說均值濾波。均值濾波就是用指定大小的、元素全為1的模糊核，對原圖進行卷積操作（其實，就是原圖像中目前位置對應的核大小的區域，各個元素相加），然後除以核的元素個數。也可以了解為，其核為：元素全為1、系數為元素個數的矩陣。

然後是方框濾波。是均值濾波的推廣：元素全為1、系數為alpha的矩陣。alpha等于核的個數時，就是均值濾波；否則一般取1（哦，為什麼要搞這麼大？難道不會超出255麻？）

再看高斯濾波。前面兩個濾波的核（也叫模闆），元素值都隻有一種。如果模闆的元素不隻一種，就是權重線性濾波了。

高斯濾波是權重線性濾波的一種，準确說是：模闆元素的分布符合二次高斯分布。高斯分布其實就是正态分布。因為一般認為噪聲的分布都符合高斯分布，那麼去噪也用符合高斯分布的模闆，效果會比較好。

通過為GaussianBlur函數傳入sigmaX,sigmaY,size等參數，函數能生成相應的符合高斯分布的模闆。然後對原圖像和模闆進行卷積操作，就得到濾波後的圖像。

opencv現在有2個非線性平滑濾波：中值濾波和雙邊濾波

中值濾波：模闆限定區域内，取像素灰階的中值（我了解為中位數），作為計算結果。中值濾波的效果是，讓與周圍像素灰階值的差比較大的像素改取與周圍像素值接近的值，消除了信号序列（這裡是模闆框定範圍内像素點灰階值）的孤立點。因為不是簡單的取均值，産生的模糊更少些，通常能比均值濾波更好地保持圖像的細節。

測試發現，在有白色噪聲的圖像上，中值濾波和均值濾波的對比效果很明顯：

雙邊濾波：

雙邊濾波是一種簡單的、非疊代的<code>保邊平滑過濾器</code>：能夠去除圖像噪聲，同時很好地保持邊界。缺點是比其他過濾器慢。

檢視opencv官方文檔，目前（opencv3.0）中，雙邊濾波器函數的實作依然有問題，“This filter does not work inplace.”

看起來有點沮喪，不管了，先了解下原理。

雙邊濾波同時考慮了空間域和值域的差别：空間域給人一種“出身”的感覺，模闆框定了你周圍的像素點，這些點不管它們灰階值是多少，你總要按相應權重對待它們（按模闆中對應元素值來處理），比如均值濾波是“一視同仁”，高斯濾波是“像沖擊波一樣從自身衰減”。空間域濾波器的效果是，能去除噪聲。

而從值域的角度看，給人一種“看後天努力程度”的感覺：對于模闆框定的周圍像素點，考慮它們的灰階值，而不去官它們當中的“老幼尊卑”。這方面的代表是alpha-截尾均值濾波器。值域濾波器的效果是，能保留邊界效果。

雙邊濾波綜合考慮了空間域和值域，其計算公式中的權重系統，是定義域核與值域核的乘積。

主要包括：線性銳化濾波（拉普拉斯算子、高頻提升濾波）、非線性銳化濾波（基于梯度的銳化濾波、最大-最小銳化變換等）

線性銳化濾波可以借助模闆卷積實作。對應積分運算的模闆卷積可以平滑圖像，反過來對應微分運算的模闆卷積可以銳化圖像。銳化模闆系數的取值，應該在中心為正而周圍遠離中心處為負。

當然，圖像銳化還可以用<code>高通濾波法</code>來做，不過不屬于模闆操作的範圍，現在還不懂，以後再說。

這次先來看看非線性銳化濾波。所謂線性還是非線性，是從最後的結果來看，計算步驟是不是線性的：雖然拉普拉斯算子是二階差分得到的，但是結果上開它等同于做線性模闆卷積運算；而Sobel算子等一階差分方法，因為要分别考慮x、y兩個方向然後再合并，整個步驟沒法簡化，是以是非線性的。從推導的角度看，要先看一階差分操作，也就是非線性的幾個算子。

梯度銳化依然是一種模闆算法卷積算法，經過一系列推導，并整理出對應的運算模闆，就是我們最終需要的。

圖像一般是二維矩陣，是以梯度銳化法一般在x、y方向分别計算出梯度幅值Gx、Gy，然後再合并。

用差分來近似微分.比如水準垂直差分:

或者交叉差分：

x、y兩個方向上差分的結果，可以通過距離公式和在一起，用來表示最後的計算結果，比如采用水準垂直差分+曼哈頓距離公式，有：

而使用交叉差分+歐幾裡得距離公式，有：

或者使用交叉差分+曼哈頓距離，有：

上式就是Roberts算子的梯度幅值公式，對應的模闆為：

梯度銳化的改進上述算法計算出來的，是一個考慮了周遭像素的、差分、然後相加的結果。這個結果拿來取代原來的像素值，不一定合适，我們可以對此加以判斷，如果它落在某個門檻值範圍内（比如大于門檻值T），才算作有效，否則仍然取原來的f(i,j)灰階值。

梯度銳化的不足考慮低頻區域中的一個點f(i,j)，其g(i,j)通常是0；再噪聲點f(i,j)，顯然它對應的g(i,j)不為0，而且還比較大。往往噪聲點在梯度銳化算法中，被增強的效果比普通點更大。是以使用此算法前盡量去除噪聲。

梯隊銳化對應的模闆？顯然上面提到的公式，對應的模闆是2x2的。這和通常使用的奇階方陣不一樣，是不實用的。無論是x方向還是y方向，2x2的方陣都僅僅是考慮了<code>半鄰域</code>，而不是<code>整個鄰域</code>。不過這個思路是可取的。Sobel算子就是考慮了整個鄰域的一階算子，當然還可以用拉普拉斯這樣的二階算子。

最簡單的、考慮了<code>整個鄰域</code>的算子，是Prewitt算子，其卷積模闆為：

顯然，它僅僅在一個方向上考慮了權值，而另一個方向上則沒有考慮。Sobel算法則是其的進一步優化。

Sobel算子用來計算圖像的導數，目的是獲得圖像邊緣。是以，它常常被用于邊緣檢測。Canny算法是比Sobel更完整的邊緣檢測算法，包括了預處理（高斯濾波）、後處理（門檻值法去除非邊緣點）。

為什麼用導數檢測邊緣？考慮一維圖像f(x)，其邊緣是一個點。作為邊緣點，其左右兩側像素灰階的變化濾肯定不一樣（否則，就是真的平滑圖像了，哪還有什麼邊界）。如果計算f(x)的導數，f(x)一定是導數中的極值。推廣到二維圖像這也是成立的。隻不過求導公式使用差分公式來近似代替了。Sobel和前面的<code>銳化梯度</code>的差別在于，它在x、y方向分别使用一個模闆進行卷積運算，得到Gx、Gy兩個分量，然後用<code>G=sqrt(Gx^2 + Gy^2)</code>得到梯度幅值。

Sobel算子，一般取模闆:

Canny是指Canny邊緣檢測算法，其步驟包括：

濾波：讀取灰階圖像後，使用高斯濾波做平滑處理（去噪）

增強：用一階偏導的有限差分來計算梯度的幅值和方向（銳化）。這一步可以使用Roberts、Sobel、Prewitt等算子,或者說，使用類似Sobel濾波器的濾波步驟。

檢測：使用門檻值法将非邊緣點去除，獲得真正的邊緣點

如此看來，Canny邊緣檢測是模闆操作的綜合應用了，既有平滑處理，也有銳化處理。

在Sobel算子中，容易計算：

其中，梯度幅角在Canny最後一步的檢測判斷中使用到。

P.S.:opencv中的Sobel函數，如果指定的模闆規格為3x3，按照前面的模闆矩陣，會産生明顯的不精确的結果。通過調用Scharr算子的模闆，效果會好些：

前面使用的是一階差分，現在使用二階差分，同樣能得到用來銳化濾波的操作。隻不過很巧妙的是，拉普拉斯算子的推導過程到最後發現，能夠等價于一個<code>權值模闆卷積操作</code>，是以是一階操作。

拉普拉斯算子是二階微分算子，也用于線性銳化濾波:

仍然使用差分的方式，容易得到：

對應的模闆是：

這是隻考慮4鄰域的情況。如果考慮8鄰域，對應的模闆是：

用原始圖像見去平滑或模糊圖像能得到非銳化掩模，将非銳化掩模加到原始圖像上能得到銳化圖像。更進一步，可以把原始圖像放大A倍後再減去平滑圖像：

其實就是稍微複雜點的線性組合了。

如果想到了什麼新的算法，或者純粹想試一試碰碰運氣，可以自定義模闆矩陣，扔給opencv的filter2d函數，就可以看到效果了。

opencv筆記4：模闆運算和常見濾波操作

繼續閱讀

查找算法之二分查找查找算法之二分查找

查找算法學習之二分查找（Python版本）——BinarySearch

CQ V1.0分詞bates(基于雙數組tire樹)—應該是目前最快的中文分詞算法

Command Network(POJ 3164)---定根最小樹形圖模闆題題目描述輸入格式輸出格式輸入樣例輸出樣例分析源程式

開源低帶寬語音編解碼器

241 Different Ways to Add Parentheses（C代碼版）

【趨高機器視覺】機器視覺技術原了解析及解決方案

CSMA/CD1． CSMA/CD的概述2． CSMA 的工作原理3． CSMA/CD控制規程及特點4． CSMA/CD協定5． CSMA/CD的優點6．結束語

極大似然法(ML)與最大期望法(EM)

cs231n斯坦福基于卷積神經網絡的CV學習筆記（一）KNN和線性分類器/分類器損失/反向傳播一，KNN圖像分類算法二，線性分類器三，線性分類器損失四，反向傳播五，神經網絡

C++ 第十五周報告1--《冒泡法排序》

筆試面試題目：滑動視窗(二)

資料結構與算法（27）——排序（二）

Dijkstra--簡易版（最短路徑）

GitHub連夜封殺！這份阿裡 10W 字内部 Java 字面試手冊到底有多強？

hdu7108哈希