概述:
根據(jù)要素位置和屬性值使用 Global Moran’s I 統(tǒng)計(jì)量測(cè)量空間自相關(guān)性。提出者為澳大利亞統(tǒng)計(jì)學(xué)家帕特里克·阿爾弗雷德·皮爾斯·莫蘭(Patrick Alfred Pierce Moran)。
Moran PAP. The interpretation of statistical maps[J]. Journal of the Royal Statistical Society B , 1948,(37):243-251.
詳細(xì)概述:
空間自相關(guān) (Global Moran’s I)工具同時(shí)根據(jù)要素位置和要素值來(lái)度量空間自相關(guān)。在給定一組要素及相關(guān)屬性的情況下,該工具評(píng)估所表達(dá)的模式是聚類模式、離散模式還是隨機(jī)模式。該工具通過(guò)計(jì)算 Moran’s I指數(shù)值、z得分和p值來(lái)對(duì)該指數(shù)的顯著性進(jìn)行評(píng)估。p值是根據(jù)已知分布的曲線得出的面積近似值(受檢驗(yàn)統(tǒng)計(jì)量限制)。
公式:
說(shuō)明:
1、空間自相關(guān)工具返回五個(gè)值:Moran’s I 指數(shù)、預(yù)期指數(shù)、方差、z 得分及 p 值。您可通過(guò)結(jié)果窗口訪問(wèn)這些值,也可以將這些值作為派生輸出值進(jìn)行傳遞,以滿足模型或腳本中的潛在使用需要。
在給定一組要素及相關(guān)屬性的情況下,該工具評(píng)估所表達(dá)的模式是聚類模式、離散模式還是隨機(jī)模式。使用 z 得分或 p 值指示統(tǒng)計(jì)顯著性時(shí),如果 Moran’s I 指數(shù)值為正則指示聚類趨勢(shì),如果 Moran’s I 指數(shù)值為負(fù)則指示離散趨勢(shì)。
2、返回的z得分與P值解釋:
p 值不具有統(tǒng)計(jì)學(xué)上的顯著性。
不能拒絕零假設(shè)。要素值的空間分布很有可能是隨機(jī)空間過(guò)程的結(jié)果。觀測(cè)到的要素值空間模式可能只是完全空間隨機(jī)性 (CSR) 的眾多可能結(jié)果之一。
p 值具有統(tǒng)計(jì)學(xué)上的顯著性,且 z 得分為正值。
可以拒絕零假設(shè)。如果基礎(chǔ)空間過(guò)程是隨機(jī)的,則數(shù)據(jù)集中高值和/或低值的空間分布在空間上聚類的程度要高于預(yù)期。
p 值具有統(tǒng)計(jì)學(xué)上的顯著性,且 z 得分為負(fù)值。
可以拒絕零假設(shè)。如果基礎(chǔ)空間過(guò)程是隨機(jī)的,則數(shù)據(jù)集中高值和低值的空間分布在空間上離散的程度要高于預(yù)期。離散空間模式通常會(huì)反映某種類型的競(jìng)爭(zhēng)過(guò)程:具有高值的要素排斥具有高值的其他要素;具有低值的要素排斥具有低值的其他要素。
常見的問(wèn)題:
Q1:可以針對(duì)不同研究區(qū)域使用全局自相關(guān)生成的 z 得分或 p 值與分析結(jié)果進(jìn)行比較嗎?
不可以。但是,如果研究區(qū)域是固定的(例如,所有分析都針對(duì)加利福尼亞的縣)、輸入字段具有可比性(例如,所有分析都涉及某種類型的人口計(jì)數(shù)),并且工具參數(shù)均相同(例如,距離范圍或距離閾值為 5,000 米的“固定距離”并且工具均使用“行標(biāo)準(zhǔn)化”參數(shù)),此時(shí),便可對(duì)統(tǒng)計(jì)學(xué)上顯著的 z 得分進(jìn)行比較,以了解空間聚類或空間離散的程度或更好地了解趨勢(shì)隨時(shí)間推移的變化情況。還可以在不斷增大距離范圍或距離閾值的情況下運(yùn)行分析,以了解在哪個(gè)距離/比例下促進(jìn)空間聚類的過(guò)程最明顯。
Q2:為何會(huì)得到大于 1.0 或小于 -1.0 的 Moran’s I 指數(shù)?
通常,Global Moran’s I 指數(shù)介于 -1.0 到 1.0 之間。只有對(duì)權(quán)重進(jìn)行了行標(biāo)準(zhǔn)化時(shí)才會(huì)這樣。如果未對(duì)權(quán)重進(jìn)行行標(biāo)準(zhǔn)化處理,則指數(shù)值可能會(huì)落在 -1.0 到 1.0 的范圍之外,這表示參數(shù)設(shè)置有問(wèn)題。
Q3:何時(shí)采用全局莫蘭指數(shù)(Global Moran’s I),何時(shí)采用局部莫蘭指數(shù)(Local Moran’s I),以及,兩者有何區(qū)別?
莫蘭指數(shù)分為全局莫蘭指數(shù)(Global Moran’s I)和局部莫蘭指數(shù)(Local Moran’s I),前者是Patrick Alfred Pierce Moran于1950年提出,用來(lái)衡量空間自相關(guān)程度的度量;后者是美國(guó)亞利桑那州立大學(xué)地理與規(guī)劃學(xué)院院長(zhǎng) Luc Anselin 教授在1995年提出的。
通常情況,先做一個(gè)地區(qū)的全局指數(shù),全局指數(shù)只是告訴我們空間是否出現(xiàn)了集聚或異常值,但并沒(méi)有告訴我們?cè)谀睦锍霈F(xiàn)。換句話說(shuō)全局Moran’I只回答Yes還是NO;如果全局有自相關(guān)出現(xiàn),接著做局部自相關(guān);局部Moran’I會(huì)告訴我們哪里出現(xiàn)了異常值或者哪里出現(xiàn)了集聚,是一個(gè)回答Where的工具。
莫蘭指數(shù)是一個(gè)有理數(shù),經(jīng)過(guò)方差歸一化之后,它的值會(huì)被歸一化到-1.0與+1.0之間。
Moran’s I大于0時(shí),表示數(shù)據(jù)呈現(xiàn)空間正相關(guān),其值越大空間相關(guān)性越明顯;Moran’s I小于0時(shí),表示數(shù)據(jù)呈現(xiàn)空間負(fù)相關(guān),其值越小空間差異越大;Moran’s I為0時(shí),空間呈隨機(jī)性。
ArcGIS中運(yùn)行莫蘭指數(shù)的注意事項(xiàng):
輸入字段嚴(yán)重偏斜(創(chuàng)建數(shù)據(jù)值的直方圖可了解此情況),空間關(guān)系的概念化或距離范圍的設(shè)置使得某些要素的相鄰要素非常少。Global Moran’s I 統(tǒng)計(jì)量是漸進(jìn)正態(tài)的,這意味著,對(duì)于偏斜數(shù)據(jù),每個(gè)要素至少需要具有 8 個(gè)相鄰要素。為距離范圍或距離閾值參數(shù)計(jì)算的默認(rèn)值可確保每個(gè)要素至少具有 1 個(gè)相鄰要素,但這可能不夠,尤其是在輸入字段中的值嚴(yán)重偏斜時(shí)。
使用反距離空間關(guān)系的概念化,并且反距離非常小。
未選擇行標(biāo)準(zhǔn)化。除非聚合方案與所分析的字段直接相關(guān),否則,只要對(duì)數(shù)據(jù)進(jìn)行了聚合處理,就應(yīng)選擇行標(biāo)準(zhǔn)化。
空間關(guān)系的概念化:
指定要素空間關(guān)系的定義方式。
INVERSE_DISTANCE—與遠(yuǎn)處的要素相比,附近的鄰近要素對(duì)目標(biāo)要素的計(jì)算的影響要大一些。
INVERSE_DISTANCE_SQUARED—與 INVERSE_DISTANCE 類似,但它的坡度更明顯,因此影響下降得更快,并且只有目標(biāo)要素的最近鄰域會(huì)對(duì)要素的計(jì)算產(chǎn)生重大影響。
反距離方法(INVERSE_DISTANCE、INVERSE_DISTANCE_SQUARED)最適合對(duì)連續(xù)數(shù)據(jù),或最適合對(duì)符合此種情形的對(duì)象進(jìn)行建模:兩個(gè)要素在空間上越靠近,它們彼此交互/影響的可能性就越大。使用此空間概念化參數(shù),每個(gè)要素都可能是其他各個(gè)要素的鄰域,而對(duì)于大型數(shù)據(jù)集,這將涉及巨大的計(jì)算量。使用反距離法時(shí),應(yīng)嘗試添加一個(gè)距離范圍或距離閾值,特別是對(duì)于大型數(shù)據(jù)集十分重要。如果將距離范圍或距離閾值參數(shù)留空,系統(tǒng)將計(jì)算距離閾值,但這可能不是分析所需的最適當(dāng)距離;默認(rèn)的距離閾值是能夠確保每個(gè)要素至少具有一個(gè)相鄰要素的最小距離。
可為0,可默認(rèn),可輸入正值。
FIXED_DISTANCE_BAND—將對(duì)鄰近要素環(huán)境中的每個(gè)要素進(jìn)行分析。在指定臨界距離(距離范圍或距離閾值)內(nèi)的鄰近要素將分配有值為 1 的權(quán)重,并對(duì)目標(biāo)要素的計(jì)算產(chǎn)生影響。在指定臨界距離外的鄰近要素將分配值為零的權(quán)重,并且不會(huì)對(duì)目標(biāo)要素的計(jì)算產(chǎn)生任何影響。此方法適用于處理點(diǎn)數(shù)據(jù)。
ZONE_OF_INDIFFERENCE—在目標(biāo)要素的指定臨界距離(距離范圍或距離閾值)內(nèi)的要素將分配有值為1的權(quán)重,并且會(huì)影響目標(biāo)要素的計(jì)算。一旦超出該臨界距離,權(quán)重(以及鄰近要素對(duì)目標(biāo)要素計(jì)算的影響)就會(huì)隨距離的增加而減小。
不可為0,可默認(rèn),可輸入正值。
CONTIGUITY_EDGES_ONLY—只有共用邊界或重疊的相鄰面要素會(huì)影響目標(biāo)面要素的計(jì)算。
CONTIGUITY_EDGES_CORNERS—共享邊界、結(jié)點(diǎn)或重疊的面要素會(huì)影響目標(biāo)面要素的計(jì)算。
國(guó)際象棋里面的Rook(車)和皇后(Queen)的走法,因此也叫做Rook’s Case和Queen’s Case。面要素計(jì)算進(jìn)行計(jì)算的話,面鄰接是最簡(jiǎn)單的一種空間關(guān)系概念化的模型。
GET_SPATIAL_WEIGHTS_FROM_FILE—將由指定空間權(quán)重文件定義空間關(guān)系。指向空間權(quán)重文件的路徑由權(quán)重矩陣文件參數(shù)指定。
標(biāo)準(zhǔn)化:
行標(biāo)準(zhǔn)化的權(quán)重通常與固定距離相鄰要素結(jié)合使用,并且?guī)缀蹩偸怯糜诨诿驵徑拥南噜徱?,這樣可減少因?yàn)橐鼐哂胁煌瑪?shù)量的相鄰要素而產(chǎn)生的偏離。行標(biāo)準(zhǔn)化將換算所有權(quán)重,使它們?cè)?0 和 1 之間,從而創(chuàng)建相對(duì)(而不是絕對(duì))權(quán)重方案。每當(dāng)要處理表示行政邊界的面要素時(shí),您都可能會(huì)希望選擇“行標(biāo)準(zhǔn)化”選項(xiàng)。
實(shí)例:
這次,我們采用湖南省2018年的122個(gè)縣的一些社會(huì)經(jīng)濟(jì)數(shù)據(jù),如GDP、第二產(chǎn)業(yè)增加值、第二產(chǎn)業(yè)從業(yè)人員、第三產(chǎn)業(yè)增加值、學(xué)校、醫(yī)院床位等等數(shù)據(jù),來(lái)進(jìn)行莫蘭指數(shù)的實(shí)驗(yàn):
之前的參數(shù)設(shè)置都已經(jīng)講過(guò)了,所以我們直接按照上方的提示設(shè)定參數(shù),其實(shí)莫蘭指數(shù)的參數(shù)蠻少,主要就一個(gè):空間關(guān)系的概念化。
因?yàn)槭紫?,空間關(guān)系的概念化選擇決定了你要不要設(shè)置距離范圍或距離閾值以及權(quán)重矩陣文件,如果你選擇了反距離,那么距離范圍可以不輸入,也可以選擇輸入;如果選擇了FIXED_DISTANCE_BAND或者ZONE_OF_INDIFFERENCE,那么最好輸入距離范圍,當(dāng)然也可以不輸入,選擇默認(rèn);如果選擇了CONTIGUITY_EDGES_ONLY或者CONTIGUITY_EDGES_CORNERS,則不需要輸入距離范圍,選擇了GET_SPATIAL_WEIGHTS_FROM_FILE,那當(dāng)然需要引入權(quán)重矩陣文件了!
其次,距離法一般我們也都是選擇歐氏距離,標(biāo)準(zhǔn)化一般都是默認(rèn)勾選ROW的。那么我們按照以下的進(jìn)行選擇,然后點(diǎn)擊生成報(bào)表,運(yùn)行。
最終會(huì)生成一張報(bào)表如下,而不是返回給我們一張花花綠綠的圖(那是局部莫蘭指數(shù)或者其他空間統(tǒng)計(jì)工具會(huì)生成的),因?yàn)樯厦嬉呀?jīng)講到,其實(shí)莫蘭指數(shù)就是告訴我們要素是否是隨機(jī)分布的,也就是說(shuō)只會(huì)給我們一個(gè)值,是或者否,僅此而已:
本文鏈接:http://m.dzac.com.cn/blog/383.html
本文標(biāo)簽:ArcGIS