現狀
傳統的子空間聚類方法雖然在HSI聚類中取得了顯著的效果,但往往忽略了資料之間固有的結構資訊。
本文貢獻
本文對基于圖卷積的子空間聚類進行了研究,提出了一種新的子空間聚類架構:圖卷積子空間聚類 Graph Convolutional Subspace Clustering(GCSC)。
(1)具體地說,該架構将資料的自表達特性重新構造到非歐幾裡德域(non-Euclidean domain)中,進而生成了一個更健壯的圖嵌入字典。
(2)我們證明了傳統的子空間聚類模型是歐氏資料架構(本文提出的)的特殊形式。在此架構的基礎上,利用Frobenius範數進一步提出了兩種新的子空間聚類模型,即Efficient GCSC(EGCSC)和Efficient Kernel GCSC(EKGCSC)。
(3)這兩種模型都有一個全局最優的閉式解,這使得它們更易于實作、訓練和實際應用。在三個流行的HSI資料集上進行的大量實驗表明,EGCSC和EKGCSC可以達到最先進的聚類性能,顯著優于許多現有的方法,具有顯著的優勢。
筆記 1
Graph convolution essentially is a special form of the Laplacian smoothing [35], which combines the features of a node and its nearby neighbors.
圖卷積本質上是拉普拉斯平滑的一種特殊形式,它結合了一個節點及其鄰近鄰居的特征。
作者提出了兩個模型:Efficient GCSC和Efficient Kernel GCSC
使用GCSC模型前需要解決兩個問題:
(1)HSI中含有許多備援波段資訊;
解決方式:
作者使用PCA降維;一方面減少了HSI中備援的波段,另一方面降低了模型在訓練過程中的計算複雜度;
另外,作者又指出,為了同時考慮到空間和光譜資訊,将每個中心像素點鄰域3D-patches表示該點(也是目前大多數文獻中采用的方式)。
(2)GCSC的模型是基于圖結構的資料,而HSI是典型的歐式資料;
解決方式:
建構了一個KNN臨近點圖【a k-nearest neighbor(kNN) graph】用于表示資料點的圖結構。具體地說,每個資料點被視為圖上的一個節點,X的K個鄰域由邊關系組成。
筆記 2
作者在文中指出,本文提出的GCSC模型和傳統的子空間聚類算法的差別:
(1)GCSC 是建構在非歐式域上;在GCSC下,傳統的子空間聚類模型可以看作是歐幾裡德域中的一個特例;
(2)GCSC 通過圖卷積将圖結構包含在内,然而傳統的子空間聚類模型是通過manifold regularization(流行正則化);
因為,GCSC 使用了一種更直接的方式探索圖資訊。