天天看點

新版白話空間統計(3):空間分布模式

公衆号\知乎:蝦神說D

轉發、轉載和爬蟲,請主動保留此聲明。

空間分布模式的英文是:spatial distribution pattern,是以也有的文章或者書上被翻譯成空間分布格局或者空間分布範例。不過我一般習慣了稱之為空間分布模式,下面就沿用分布模式這個術語來進行說明了。

在地理學中,“空間模式”一般是指人或者物體在現實世界中的組織和位置。可以指它們之間的距離的遠近或者說它們之間的呈現的相對或者絕對位置的規律。

新版白話空間統計(3):空間分布模式

空間分布模式無處不在。它們既包括自然發生的模式,如某些植物會在某一地區集中生長;也可以是人為的模式,比如走在城市中發現便利店的機率。因為人類的思維無法記憶和處理大量的原始資訊,是以天然的就會去尋找模式和趨勢,并會把發現的這種模式稱之為“經驗”。(下面這張圖真不是廣告……雖然我是從廣告裡面截圖出來的)

新版白話空間統計(3):空間分布模式

先不說自然界中天然存在所有的對象,作為社會經濟發展中的重要研究手段,空間分布模式對社會形态進行研究時,在某種意義上是對人類行為的研究。

研究空間分布模式的研究人員試圖了解為什麼(這種)物體會被放置在(這個)特定的位置。例如,在全市範圍内,對空間分布模式的研究,會對包括企業的位置、特定類型企業的數量,以及企業彼此之間距離以及與住宅區的方位等資訊進行總體分析。在這種情況下,空間分布模式可以解釋企業之間的競争關系或者政策對某個行業的影響力等。

空間分布模式的研究作用非常之廣泛,比如它可以幫助經濟學領域中的商業廣告和分銷政策之間的因果聯系。也有助于環境科學了解特定區域的特征以及人類對它們的反應等等。

——好吧,我承認,上面這幾段話,是我翻譯及改寫自國外文獻裡面的(寫在論文裡面也木得問題啊),是以和蝦神的風格不搭,就不算字數了,下面才是蝦神的風格。

任何事務,在實體空間中出現都會被記錄下一個位置,單個物體是沒有分布這種形容詞的,隻有多個事務同時出現(在同一區域内),才會有分布一說。是以分布一般是指多個事務之間的相對方向、距離等實體定義。

比如籃球上經常有的三角戰術:

新版白話空間統計(3):空間分布模式

就可以說:在這次進攻中,湖人隊的主力進攻陣容呈現了三角分布。

形容分布可以有多種多樣,但是分布的模式,作為規律的高度抽象提煉,一般就隻有以下幾種:

新版白話空間統計(3):空間分布模式

如果把随機和均勻合并為一種說法,那麼空間分布的模式,就隻剩下:聚集、離散和随機三種模式。

空間分布模式作為空間統計學最重要的研究内容(沒有之一),甚至可以狹義的說,空間統計學,主要的工作就是研究空間資料的分布模式的。

下面通過一張圖可以很明顯表達出來,三種模式:

新版白話空間統計(3):空間分布模式

看到這裡,不知道大家是否會有這樣一個疑問:

你所有的例子裡面,空間位置都是在變化的,比如上篇文章裡面的學生跑出教室的随機分布,還是密碼之下的均勻分布,或是解散之後的聚集分布,用于研究的樣本個體的位置都是在不斷變化,是以非常容易就分辨出它們屬于那種分布模式。

新版白話空間統計(3):空間分布模式

但是,我們日常的研究中,比如做省域經濟研究的時候,樣本的空間位置是完全不會發生變化的:

新版白話空間統計(3):空間分布模式

這樣,不就永遠都是一種模式了麼?

當然,某些時候,也是有意外的,比如東北第四省——海南:

新版白話空間統計(3):空間分布模式

言歸正傳——

我們做空間分析的時候,絕大部分都是不涉及位置變化的——資料的變化涉及到的是時序分析的範疇,時空一體化分析暫時不是我們的讨論範疇,我們通常隻讨論截面資料的分析。

通常,空間位置在一次分析中(時序分析除外),并不會發生改變,是以我們一般通過屬性資料的變化來判斷空間分布,說起來可能很拗口,那麼我們看看下面幾張圖:

如果說大學時候上課的位置可以代表身份,是以我們可以很明顯的看出聚集現象:

新版白話空間統計(3):空間分布模式

那麼在中國小,一般座位都是老師給安排的,是以從座位的分布,就能看出老師風格了:

第一種,就是老師直接把學生拉出去排隊,按高矮順序,然後直接安排座位(一般新生入學采用的模式,因為老師還不知道你是學霸學渣……):

新版白話空間統計(3):空間分布模式

這樣不管你願意不願意,或者你的成績如何,或者你的興趣愛好如何,都不會被考慮了,直接扔到了座位上——這種情況,屬于被判定為随機。

第二種,就是經過測試考之後,老師一般習慣于進行學霸編組在一起……這種組合,當然就是所謂是聚集分布了,學霸和學霸在一起,學渣和學渣在一起。

新版白話空間統計(3):空間分布模式

那麼還有第三種分布,就是考試的時候,為了避免作弊,是以可能會出現兩個年級混合編組的坐法:

新版白話空間統計(3):空間分布模式

每個學生,周邊都不會出現自己人……這就是所謂的離散分布。

如果把每個學生的特征,數值化之後,變成他們的一個屬性,那麼以上三種分布模式,就可以很明确的看出,在計算空間分布的時候,他們的位置(三張圖之間)相對位置和絕對位置實際上是沒有變化的,隻是在每個位置上面的屬性資訊發生了變化,進而形成了:

  • 随機——誰也不知道旁邊有沒有自己的同伴。
  • 聚集——學霸和學渣紮堆出現。
  • 離散——隻要在我周邊的,一定不是我自己的人。

三種空間分布模式。

這也就是我們通常在空間分析的時候,經常要做的事情,空間位置不發生改變,但是屬性資訊發生了改變,進而空間分布模式也發生了改變。

當然,上面的圖形的位置分布,還是比較理想的狀态,實際上我國這種自然形成的行政區劃,不可能出現如此有規律的分布,是以如何控制臨近關系呢?這就得通過定義空間權重矩陣來進行控制了,這個内容,我們後面會開個專題來講。

那麼,空間分布模式,如何進行計算呢?下一篇我們來講講空間分布模式的第一個計算方法:莫蘭指數(Moran‘s I)。

繼續閱讀