天天看點

灰色神經網絡的預測算法_基于卷積長短期記憶網絡的NDVI預測方法研究

作 者 信 息

潘信亮1,張 震1,江 濤1,隋百凱1,孫玉超2

(1. 山東科技大學 測繪科學與工程學院,山東 青島 266590;2. 國家海洋局 南海規劃與環境研究院,廣東 廣州 510300)

【摘要】植被作為生态系統的重要組成部分,分析、預測其分布特征對目标地物監測、估産、自然災害預測等應用具有重要意義。選取内蒙古自治區錫林郭勒盟為研究區,基于卷積長短期記憶網絡(ConvLSTM),利用2000年2月至2012年12月500 m分辨率的MODIS逐月NDVI時序特征影像産品(MODND1M),通過對不同參數進行優化與調整,建立預測模型,實作了2013年逐月NDVI值的預測,并與同期NDVI産品進行對比分析。結果表明,植被生長周期4~10月預測資料整體上與産品資料趨勢一緻,決定系數R2平均值為0.678,精度最高可達0.835。該預測算法能充分利用空間時序特征實作對NDVI的預測,并為農作物估産、地上植被生物量估算等研究提供有力的技術支撐。

【關鍵詞】ConvLSTM;時間序列;NDVI預測;MODIS産品

【中圖分類号】F224.9 【文獻辨別碼】A 【文章編号】1672-1586(2020)02-0060-08

引文格式:潘信亮,張 震,江 濤,等. 基于卷積長短期記憶網絡的NDVI預測方法研究[J].地理資訊世界,2020,27(2):60-67.

正文

0 引 言

植被指數(Vegetation Index,VI)是通過對遙感資料相應波段進行線性或非線性運算得到的一種能很好地反映作物生長狀況、代謝強度和監測植被健康程度的名額因子,是作物估産、草地生産力計算、植被制圖和生态環境評價等應用的重要參數和名額,在植被遙感應用中具有重要的實體意義。目前常用的植被指數有內插補點植被指數、比值植被指數、歸一化植被指數及在他們基礎上的改進型。其中歸一化植被指數(Normalized Vegetation Index,NDVI)相對于比值和內插補點植被指數能更好地消除背景噪聲,具有更強的抗幹擾能力,是以成為應用最多且最有效的植被指數,與植被的覆寫度、長勢密切相關,能很好地表示和反映植被空間分布及生長狀況。

國内外學者利用NDVI在植被覆寫度、氣候變化響應、環境監測、農業估産等方面做了應用研究,但均是利用已知的曆史NDVI資料進行模組化,會導緻估産的滞後性,不能做到對未來資料的預測。而傳統的預測方法如回歸分析法、時間序列分析法、灰色預測法等都存在其預測的弊端。回歸分析法誤差較大,适合中期的預測,并且回歸模型是一種因果關系模型;灰色預測法有較大的變動性,适合短期的預測,僅可處理線性關系;時間序列法準确性差且僅适合短期預測,傳統方法都有其局限性而不适合于本文研究。近年來,神經網絡迅速發展,憑借優秀的處理非線性資料能力、自适應力、泛化性和簡便性而成為主流預測模型。循環神經網絡(Recurrent Neural Network,RNN)是深度學習領域重要的分支,差別于其他神經網絡,主要用于處理時間序列資料,其最大的特點是在上時刻的輸出與下時刻的樣本同時輸入下一神經元,該網絡結構能夠記憶曆史輸入資料,這種串聯的網絡結構非常适合于時間序列資料。然而RNN結構的記憶序列較短,隻能記憶短時期的上下文資訊,而面對長序列的資訊,随着學習量的增多或者學習周期的增長會導緻梯度消失或梯度爆炸的現象。長短期記憶網絡(Long Short-Term Memory, LSTM)則是針對RNN不足進行的改進,是由Hochreiter等首次提出并在近期被Alex Graves改良和推廣,改良的LSTM在隐含層神經元中增加了遺忘門、輸入門和輸出門3個門控的設定以解決序列的長期依賴及梯度消失問題。近年來,有學者利用該深度學習算法對氣象溫度進行時間序列模組化,通過分析國内外研究現狀及對時間序列預測模型的研究與對比,提出了改進深度學習架構來進行溫度時間序列預測的思路,最終證明,在深度前饋網絡中加入時序特征的天氣預報模型,效果要明顯優于不考慮時序的模型。但是LSTM隻是針對于一維時序資料,無法對空間資料進行預測分析。Xingjian Shi等針對該不足提出了卷積長短期記憶網絡模型,該模型可以直接對空間資料進行處理,實驗證明該算法在時空上解決了臨近降水預報的問題,在捕獲時空相關性方面具有較好的效果。

ConvLSTM具有直接處理空間資料的優勢,本文探究将該網絡算法應用于遙感影像預測分析中的可行性,選擇内蒙古錫林郭勒盟為研究區,利用2000~2012年逐月的MODIS NDVI時序特征影像産品,在時空尺度上對2013年NDVI進行逐月預測,并利用同期MODIS産品對預測結果進行精度評價。

1 研究基礎

1.1 研究區概述

錫林郭勒盟是内蒙古自治區所轄盟,位于中國正北方,内蒙古自治區中部(如圖1所示),屬北部溫帶大陸性氣候,其主要氣候特點是風大、幹旱、寒冷。年平均氣溫0℃~3℃,結冰期長達5個月,寒冷期長達7個月,1月氣溫最低,平均-20℃,為華北最冷的地區之一。該盟是一個以高平原為主體,兼有多種地貌的地區,地勢南高北低,東、南部多低山丘陵,盆地錯落其間,為大興安嶺向西和陰山山脈向東延伸的餘脈。西、北部地形平坦,零星分布一些低山丘陵和熔岩台地,為高原草場,草原類型豐富。

灰色神經網絡的預測算法_基于卷積長短期記憶網絡的NDVI預測方法研究

圖1 研究區位置圖

Fig.1 Location of study area

1.2 資料源擷取

研究采用的資料為MODIS中國月合成産品NDVI資料集MODND1M,其空間分辨率為500 m,采用最大合成法擷取月内每天的最大值。資料來源于中國科學院計算機網絡資訊中心地理空間資料雲平台(http://www.gscloud.cn)。資料以月為機關選取從2000年2月至2013年12月共167幅NDVI影像,影像産品的大小為883×1 498。

1.3 資料預處理

NDVI取值範圍為[-1,1],考慮資料負值較少,在訓練過程中會增加網絡負擔,為利于後續神經網絡提取特征,加快網絡收斂速度,建立最優模型,需要對原始資料進行Min-Max歸一化處理,公式如下:

灰色神經網絡的預測算法_基于卷積長短期記憶網絡的NDVI預測方法研究

式中,X為影像歸一化結果;x為影像中原始NDVI值;xmax,xmin分别為所有使用預測網絡進行訓練和測試NDVI産品中的最大值、最小值。通過Min-Max歸一化後,NDVI取值範圍變為[0,1],避免了負值的影響,利于神經網絡的收斂,加快神經網絡預測效率。

1.4 研究技術路線

ConvLSTM網絡能充分提取影像空間特征輸入到網絡中,再不斷學習時序影像的特征,經過優化網絡參數,得到空間資料在時序特征上的規律,以完成網絡的訓練和測試。本文對NDVI影像處理主要包含預處理、網絡訓練、預測、反歸一化等4個部分。首先将影像歸一化并生成輸入網絡前的時序隊列資料,使用ConvLSTM網絡對輸入的時序資料進行訓練和預測,最後對預測結果進行反歸一化得到最終的預測産品。總體流程如圖2所示。

灰色神經網絡的預測算法_基于卷積長短期記憶網絡的NDVI預測方法研究

圖2 研究總體技術路線圖

Fig.2 Overall research roadmap

2 實驗原理

2.1 ConvLSTM網絡

ConvLSTM是在LSTM網絡的基礎上進行的改進,主要針對二維的影像資料輸入,利用卷積操作提取每個時間點處資料的空間特征,然後利用LSTM原理在時間次元上學習長期特征,進行長時間序列預測,使得網絡預測能夠同時掌握空間與時間上的特征。ConvLSTM較LSTM相比,是一種端到端的網絡模型,從輸入到狀态和狀态到狀态的轉換中都具有卷積結構,通過對圖像進行卷積運算,提取資料空間特征,然後通過輸入門與忘記門考慮新資料的輸入與上一時間點的輸出,綜合形成新的細胞狀态,最後通過輸出門确定本時間點的輸出。細胞結構如圖3所示。下面詳細介紹網絡中的具體運算和運作原理。

灰色神經網絡的預測算法_基于卷積長短期記憶網絡的NDVI預測方法研究

圖3 ConvLSTM細胞結構圖

Fig.3 The cell structure of ConvLSTM

1)卷積運算

卷積運算中包括卷積核及數字圖像,卷積核指進行卷積的濾波器,卷積主要依靠卷積核的滑動進行運算,而數字圖像指需要進行卷積運算的圖像。卷積開始,卷積核于數字圖像左上角開始滑動,滑動步長可自定義。每次滑動,在圖像上提取卷積核大小的視窗,将卷積核與視窗内數值對應相乘并相加,最後将計算結果取代視窗中心像元像素值,如圖4所示。

灰色神經網絡的預測算法_基于卷積長短期記憶網絡的NDVI預測方法研究

圖4 卷積示意圖

Fig.4 Schematic diagram of the convolution

卷積示意圖中,每當卷積核運算結束目前視窗後,根據步長大小向右移動步長距離,以此類推,自左向右,自上而下,計算完畢可提取圖像特征形成一幅新的圖像。卷積運算具有權值共享、局部連結的特點,能有效降低計算複雜度,加速收斂速度。ConvLSTM将LSTM與卷積運算結合,可以将卷積計算出來的特征直接輸入到預測模型中,極大地提升了預測網絡的使用率和應用價值。

2)Sigmoid函數

Sigmoid函數是神經網絡中比較常用的門檻值函數,可以将變量映射到[0,1]之間。Sigmoid函數由下列公式定義。

灰色神經網絡的預測算法_基于卷積長短期記憶網絡的NDVI預測方法研究

經過Sigmoid函數運算後,門控設定可以按[0,1]間數字比例選擇輸入資料,如遺忘門通過函數輸出控制遺忘比例,輸入門控制輸入比例,輸出門則控制本次細胞狀态的輸出比例。

3)tanh函數

tanh函數為雙曲正切函數,對于輸入的資料,tanh函數可以将其映射至[-1,1]之間。tanh函數公式定義如下所示。

灰色神經網絡的預測算法_基于卷積長短期記憶網絡的NDVI預測方法研究

在ConvLSTM細胞中,tanh函數主要處理細胞狀态,得到[-1,1]間的值。

4)ConvLSTM細胞内部運算

ConvLSTM細胞内部計算公式如下所示:

灰色神經網絡的預測算法_基于卷積長短期記憶網絡的NDVI預測方法研究

式中,*代表卷積運算,為Hadamard乘積;Xt為t時刻神經元的輸入;ht-1為t-1時刻神經元輸出;Wxi,Wxf, Wxc,Wxo分别為不同卷積運算中Xt的權重;Whi,Whf,Whc, Who為ht-1的權重;bi,bf,bc,bo為卷積運算的偏置值。it控制輸入門,它利用sigmoid函數對輸入的新資料及上以神經元的輸出進行選擇,決定該神經元的輸入資訊。ft控制遺忘門,輸入參數同輸入門,按比例遺忘上一神經元的輸出,即控制保留上一神經元多少資訊進入該神經元。Ct為t時刻神經元的細胞狀态,它結合上一神經元的細胞狀态及t時刻輸入的新資料,形成新的細胞狀态。最後是輸出門,通過門控設定,将本次細胞狀态按比例輸出,即為本次細胞輸出ht。

2.2 評價名額

通過決定系數(R²)、均方根誤差(RMSE)、平均絕對誤差(MAE),對得到的預測結果進行分析評價,評定預測結果精度。公式(8)~(10)中n為資料個數,yi為真實資料值,

灰色神經網絡的預測算法_基于卷積長短期記憶網絡的NDVI預測方法研究

為預測資料值,

灰色神經網絡的預測算法_基于卷積長短期記憶網絡的NDVI預測方法研究

為真實資料的均值。

灰色神經網絡的預測算法_基于卷積長短期記憶網絡的NDVI預測方法研究

決定系數(R²)又稱拟合優度,表示了預測值的拟合程度如何。公式(8)中,SSR為回歸平方和,SST為總平方和。

灰色神經網絡的預測算法_基于卷積長短期記憶網絡的NDVI預測方法研究

均方誤差是真實值與預測值之差平方的期望值,可評價資料的預測程度,均方根誤差(RMSE)為均方誤差的算術平方根,用來衡量觀測值與真實值之間的偏差,RMSE越小,預測精度越高。

灰色神經網絡的預測算法_基于卷積長短期記憶網絡的NDVI預測方法研究

平均絕對誤差(MAE)又稱平均絕對離差,是所有單個觀測值與算術平均值的偏差的絕對誤差的平均值,相比絕對誤差能更好地反映預測誤差的實際情況。

3 實驗與分析

基于ConvLSTM網絡,在網絡環境設定的基礎上,通過生成時序隊列組合和反歸一化等處理,對實驗方案進行設計和參數優化,并對實驗結果進行精度評價。

3.1 環境設定與運算流程

本實驗是在Linux系統下,基于Python語言,借助Keras架構搭建ConvLSTM,具體參數見表1。

表1 環境配置

Tab.1 Computer confifiguration

灰色神經網絡的預測算法_基于卷積長短期記憶網絡的NDVI預測方法研究

3.2 時序隊列組合

類似于語音識别,輸入資料的時序特征是網絡的重要參數,錯誤的輸入會直接導緻網絡的病态預測,是以資料的輸入必須按照規定時序進行排列。将NDVI影像按時間順序組成時間隊列資料。根據NDVI變化規律選取适當的時間隊列長度,進而将資料分解為由若幹隊列組成的隊列組合。

如圖5所示,設隊列長度為n,按照時間順序将NDVI分為若幹組合。用X1~Xn共n張影像預測Xn+1~X2n共n張影像,此為第一隊列組。去除X1,引入X2n+1,用X2~Xn+1共 n張影像預測Xn+2~X2n+1共n張影像,此為第二隊列組。隊列組合的前進步長為1,即以1為基本機關逐次向前推進形成隊列組合,以完成所有時序輸入資料的學習。

灰色神經網絡的預測算法_基于卷積長短期記憶網絡的NDVI預測方法研究

圖5 時序隊列組合圖

Fig.5 Time series chart

3.3 反歸一化處理

由于預進行中對神經網絡的輸入資料進行了歸一化操作,是以網絡輸出結果與實際 NDVI不屬同一量級,并非最終預測結果,需要對其進行反歸一化得到最終預測NDVI。

灰色神經網絡的預測算法_基于卷積長短期記憶網絡的NDVI預測方法研究

公式(11)為反歸一化公式,x為最終預測結果,即預測的NDVI值,取值範圍為[-1,1],X為神經網絡輸出結果;xmax,xmin為原始資料中的最大、最小值。通過反歸一化後的N D V I資料為最終預測結果,可進行後續精度評價。

3.4 實驗方案設計與參數優化

為精确預測2013年的NDVI資料,實驗在對隊列長度、Batch_size、卷積核數等超參數進行優化設定的基礎上,根據環境配置及預測要求,設計了9種實驗方案進行預測計算,并對其結果進行精度評價與分析,最終确定最優參數與實驗模型。方案的不同參數設定見表2。 

表2 實驗方案設計

Tab.2 Experimental design

灰色神經網絡的預測算法_基于卷積長短期記憶網絡的NDVI預測方法研究

其中,隊列長度指資料預測的時間序列長度,如利用2012年12個月資料預測2013年資料,則隊列長度為12;Batch_size是每次輸入神經網絡進行訓練的隊列個數;層數是指神經網絡隐藏層層數;卷積核數代表隐藏層内進行卷積運算的卷積核個數。采用平均絕對誤差、交叉熵等作為網絡的損失函數,采用Adam、Adadelta等優化器進行反向傳播進而調整網絡參數。對所有的分類方案訓練次數均設定為100次,使用143個月的NDVI作為訓練資料對2013年4~10月的NDVI進行預測,分别使用MAE、RMSE、R2進行精度分析,以2013年9月為例對預測成果進行整理見表3。

表3 2013年9月份方案精度對比

Tab.3 Accuracy analysis in September 2013

灰色神經網絡的預測算法_基于卷積長短期記憶網絡的NDVI預測方法研究

由表中可以看出,均方根誤差及平均絕對誤差在方案V中精度達最高分别為0.065及0.052,而決定系數在方案VII中最高為0.842,方案V及方案IX次高為0.835。綜合評價最優方案為方案V。

考慮實地環境,由于錫林郭勒盟地區冬季天氣寒冷,不宜作物生長,植被覆寫度較小,反映為NDVI值較小,不具研究意義,是以本實驗着重研究4~10月NDVI資料,并對預測結果制作箱體圖進行直覺展示,其中箱體内部‘□’号為7個月預測結果的均值,如圖6所示。

灰色神經網絡的預測算法_基于卷積長短期記憶網絡的NDVI預測方法研究

圖6 設計方案精度對比圖

Fig.6 Charts of accuracy comparison

從圖6中看出,當隊列長度為12時,其均方根誤差和平均絕對誤差明顯小于隊列長度為3和6的,精度較高。但方案V至方案IX起伏較小,總體變化不大,其中方案V誤差平均值最小并在誤差最小值上表現優異,方案表現較為穩定。

9種方案的R²精度,隊列長度為12的方案同樣明顯優于隊列長度為3及6的,方案V、VII、IX上4分位數均達0.8以上,具有較高精度,但方案V平均值最高,最為穩定。

綜合考慮精度對比結果,按方案V設定參數進行預測時,3個評價名額精度達最高且表現穩定,是以最終標明方案V為實驗方案。方案V神經網絡采用三層ConvLSTM層,每層卷積核大小為3×3,卷積核數為4,隊列長度為12,損失函數采用Binary_crossentropy,用來計算預測值與真實值之間的Sigmoid交叉熵。優化器采用Adam,它為較常用的優化器,實作簡單,計算高效,對記憶體需求少。Batch_size設定為1,即每次讀入網絡1個時間隊列,可以有效減少記憶體消耗。

4 結果與評價

4.1 實驗結果

實驗具體将2000年2月至2011年12月共143幅NDVI影像作為訓練資料集,将2012年1月至2013年12月共24幅影像作為測試資料集。考慮植被生長周期,設時間序列長度Sequence為12,是以訓練資料共有120個隊列組合。網絡模型随疊代次數而變化的Loss值如圖7所示,由于網絡在疊代次數達到90次時基本已經完全收斂,是以将Epochs設定為100次,既避免了網絡過度訓練,又保證了網絡精度。

灰色神經網絡的預測算法_基于卷積長短期記憶網絡的NDVI預測方法研究

圖7 網絡疊代損失圖

Fig.7 Relationship between iteration times and losses

通過訓練後的ConvLSTM網絡利用2012年NDVI資料對2013年進行逐月預測,對網絡輸出結果進行反歸一化,得到與NDVI産品同一量級的預測值,選取2013年4~10月産品資料與預測資料如圖8所示。

灰色神經網絡的預測算法_基于卷積長短期記憶網絡的NDVI預測方法研究

圖8 2013年實驗結果對比圖

Fig.8 Comparison of experimental results in 2013

從圖8中可以看出,錫林郭勒盟東部地區NDVI較大,植被覆寫度較高,西部的 NDVI值相對較小,植被稀疏。預測資料與産品資料總體趨勢基本相同,具有較高的拟合度,但相比産品資料存在偏高估現象,預測數值略大。

4.2 精度評價

為客觀驗證明驗預測結果的準确性,以2013年9月NDVI影像為例,在研究區随機提取500個随機點做定量精度分析,如圖9所示。

灰色神經網絡的預測算法_基于卷積長短期記憶網絡的NDVI預測方法研究

圖9 研究區随機點分布圖

Fig.9 Distribution of random points in the study area

由圖10可得,預測與産品資料的決定系數R²高達0.835,具有很高的拟合度,但回歸系數為0.723,預測資料總體存在略高估現象。2013年4~10月預測結果的MAE、RMSE及R2精度資料如圖11所示。

灰色神經網絡的預測算法_基于卷積長短期記憶網絡的NDVI預測方法研究

圖10 産品值與預測值的散點圖及拟合效果圖

Fig.10 The scatter plot and linear fifitting of product values and prediction values

灰色神經網絡的預測算法_基于卷積長短期記憶網絡的NDVI預測方法研究

圖11 預測結果精度分析圖

Fig.11 Diagram of accuracy analysis

從圖11可以看出,平均絕對誤差和均方根誤差從4~10月均有先增大後減少的趨勢,并在6月表現為最大,最小平均絕對誤差MAE、均方根誤差RMSE都是在4月,分别為0.026、0.032,平均值分别為0.081、0.063;決定系數R²呈現不斷提高的趨勢直到9月最高為0.835,10月反而達到最低為0.401;5~9月NDVI的預測結果的平均絕對誤差及均方根誤差都在0.12以下,決定系數均在0.69以上,模型能夠掌握NDVI影像的空間及時間特征,預測結果良好,具有較高的預測精度。而在4月與10月時平均絕對誤差與均方根誤差較其他月份表現更好,但決定系數卻在0.5左右,相對其他月份表現略差。原因為在錫林郭勒盟區域植被返青期多集中于4月中旬及下旬,少數出現在4月上旬,黃枯期均多集中在10月中旬。在返青期及黃枯期階段,植被初生或接近枯萎,植被覆寫度相對較小,NDVI值偏小,是以當預測結果與真實值有較小偏差時,反映到決定系數可能會出現較大誤差,導緻出現決定系數偏小的問題。就總體而言,網絡模型的輸出結果比較穩定,無奇異值出現,預測誤差較小,精度較高。

5 結束語

本文研究了一種基于卷積長短期記憶網絡預測NDVI資料的方法,該網絡模型結合了卷積神經網絡及LSTM兩者各自的優點,既能像卷積神經網絡一樣提取二維影像圖的空間特征,又能利用LSTM的優點,在長時間序列上進行影像預測,是以,ConvLSTM能同時保證空間跟時間的特征,實作對NDVI影像的預測。得到如下結論:

1)通過實驗預測及精度分析,最終得到ConvLSTM的預測結果R2最高能達到0.835,MAE、RMSE精度最高分别為0.026、0.032,證明網絡模型能夠實作對NDVI影像的預測并具有較高的預測精度。

2)從預測資料與産品資料對比可看出,網絡模型預測趨勢一緻且具較高精度,但結果存在略高估計現象,後續希望通過添加改正系數,調整預測結果,使其整體更接近真實資料值,進一步提高預測精度。

3)通過試驗方案的比較選擇及模型預測結果的精度分析,可得出ConvLSTM能夠實作長時序影像的預測且有較高精度,方法可行。 

灰色神經網絡的預測算法_基于卷積長短期記憶網絡的NDVI預測方法研究

本期回顧

灰色神經網絡的預測算法_基于卷積長短期記憶網絡的NDVI預測方法研究

時空大資料與新型城鎮化研究

· 新型城鎮化定量研究的時空大資料應用需求分析

· 基于多元時空資料的新型城鎮化動态監測名額體系研究

· 基于人群流動大資料的新型城鎮化品質與對外交通協同發展研究

· 基于城市微網誌簽到資料的人群活動時空特征分析

· 基于多源時空資料的粵港澳大灣區建設用地擴張及動力機制研究

· 基于多源大資料的武漢城市圈城際通勤分布及影響因素研究

· 基于夜間燈光遙感的城市垂直空間擴充研究——以武漢為例

· 基于深度學習的公民參與城市治理的時空格局研究 ——以蘇州市為例

· 基于百度大資料的城市公共廁所空間布局合理性評價

理論研究

· 面向無測風區域的複雜地形風場模拟研究

郵箱變更聲明

·《地理資訊世界》郵箱變更聲明

網站開通公告

·關于開通《地理資訊世界》網站的公告

誠聘特約審稿專家

·誠聘|《地理資訊世界》誠聘特約審稿專家

專題組稿

·約稿函|《地理資訊世界》關于開辟“博士綜述論壇”專欄的約稿函

灰色神經網絡的預測算法_基于卷積長短期記憶網絡的NDVI預測方法研究
灰色神經網絡的預測算法_基于卷積長短期記憶網絡的NDVI預測方法研究
灰色神經網絡的預測算法_基于卷積長短期記憶網絡的NDVI預測方法研究
灰色神經網絡的預測算法_基于卷積長短期記憶網絡的NDVI預測方法研究
灰色神經網絡的預測算法_基于卷積長短期記憶網絡的NDVI預測方法研究