本文接上篇:ArcGIS空間統(tǒng)計(jì)—Moran’s莫蘭指數(shù)(上)
概述:
根據(jù)要素位置和屬性值使用 Global Moran’s I 統(tǒng)計(jì)量測(cè)量空間自相關(guān)性。提出者為澳大利亞統(tǒng)計(jì)學(xué)家帕特里克·阿爾弗雷德·皮爾斯·莫蘭(Patrick Alfred Pierce Moran)。
Moran PAP. The interpretation of statistical maps[J]. Journal of the Royal Statistical Society B , 1948,(37):243-251.
詳細(xì)概述:
空間自相關(guān) (Global Moran’s I)工具同時(shí)根據(jù)要素位置和要素值來(lái)度量空間自相關(guān)。在給定一組要素及相關(guān)屬性的情況下,該工具評(píng)估所表達(dá)的模式是聚類模式、離散模式還是隨機(jī)模式。該工具通過(guò)計(jì)算 Moran’s I指數(shù)值、z得分和p值來(lái)對(duì)該指數(shù)的顯著性進(jìn)行評(píng)估。p值是根據(jù)已知分布的曲線得出的面積近似值(受檢驗(yàn)統(tǒng)計(jì)量限制)。
公式:
上次我們將了莫蘭指數(shù)的參數(shù)該如何選擇,以及每一個(gè)指數(shù)的含義解釋,想必大家都已經(jīng)知道了莫蘭指數(shù)選擇的參數(shù)其實(shí)最重要的就一個(gè),也就是空間關(guān)系的概念化,那么這次我們來(lái)講莫蘭指數(shù)的結(jié)果如何進(jìn)行解釋。
上圖是莫蘭指數(shù)返回給我們的這張圖表,其實(shí)也就是全部的莫蘭指數(shù)結(jié)果,首先在左上角是最重要的三個(gè)指數(shù),莫蘭指數(shù)、z得分以及p值。
首先我們要看的其實(shí)是z得分以及p值,莫蘭指數(shù)放在最后看:
p值,p-value,,probability,表示概率。對(duì)于模式分析工具來(lái)說(shuō),p值表示所觀測(cè)到的空間模式是由某一隨機(jī)過(guò)程創(chuàng)建而成的概率。當(dāng)p很小時(shí),意味著所觀測(cè)到的空間模式不太可能產(chǎn)生于隨機(jī)過(guò)程(小概率事件),因此您可以拒絕零假設(shè)。您可能會(huì)問(wèn)這樣的問(wèn)題:要小到什么程度才算足夠小?這是一個(gè)非常好的問(wèn)題。
z得分,z-score,表示標(biāo)準(zhǔn)差的倍數(shù)。例如,如果工具返回的z得分為+2.5,我們就會(huì)說(shuō),結(jié)果是2.5倍標(biāo)準(zhǔn)差。如下所示,z得分和p值都與標(biāo)準(zhǔn)正態(tài)分布相關(guān)聯(lián)。
觀察上圖,其實(shí)也就是說(shuō),上圖曲線下方是隨機(jī)分布的正態(tài)分布概率圖,如果P值小于0.01,可以發(fā)現(xiàn)也就是隨機(jī)分布的可能性落在了最左邊藍(lán)色或者最右邊紅色的區(qū)域內(nèi),但是這個(gè)可能性是0.01,即1%,也就是說(shuō),我們觀察的空間模式是隨機(jī)分布的可能性為1%,也就是有99%的可能性為不是隨機(jī)分布,有可能是聚類或者離散模式,但是這另說(shuō)。在統(tǒng)計(jì)意義上來(lái)講,也就是說(shuō)在99%的置信度上拒絕原假設(shè),即有99%的把握認(rèn)為原假設(shè)(隨機(jī)分布)是不可能的。若0.05,也就是說(shuō)在95%的置信度上拒絕原假設(shè),即有95%的把握認(rèn)為原假設(shè)(隨機(jī)分布)是不可能的。
1、Z值與P值有何用?
大多數(shù)統(tǒng)計(jì)檢驗(yàn)在開(kāi)始時(shí)都首先確定一個(gè)零假設(shè)。模式分析工具的零假設(shè)是完全空間隨機(jī)性 (CSR),它或者是要素本身的完全空間隨機(jī)性,或者是與這些要素關(guān)聯(lián)的值的完全空間隨機(jī)性。
模式分析工具所返回的 z 得分和 p 值可幫助您判斷是否可以拒絕零假設(shè)。通常,您將運(yùn)行其中一種模式分析工具,并希望 z 得分和 p 值表明可以拒絕零假設(shè),這就意味著:您的要素(或與要素關(guān)聯(lián)的值)表現(xiàn)出統(tǒng)計(jì)意義上的顯著性聚類或離散模式,而不是隨機(jī)模式。
如果您在景觀分布(或空間數(shù)據(jù))中發(fā)現(xiàn)了空間結(jié)構(gòu)(如聚類),就證明某些基礎(chǔ)空間過(guò)程在發(fā)揮作用,而這方面通常正是地理學(xué)者或 GIS 分析人員所最為關(guān)注的。
2、置信度
z 得分(標(biāo)準(zhǔn)差)
p 值(概率)
置信度
< -1.65 或 > +1.65
< 0.10
90%
< -1.96 或 > +1.96
< 0.05
95%
< -2.58 或 > +2.58
< 0.01
99%
置信度為 95% 時(shí),z 得分的臨界值為 -1.96 和 +1.96 倍標(biāo)準(zhǔn)差。如果此時(shí),與其關(guān)聯(lián)的未經(jīng)校正的 p 值為 0.05,但z 值在 -1.96 和 +1.96 之間,則未經(jīng)校正的 p 值將大于 0.05,因而不能拒絕零假設(shè),因?yàn)樗憩F(xiàn)出的模式很可能是隨機(jī)空間過(guò)程產(chǎn)生的結(jié)果。如果 z 得分在該范圍之外(例如,-2.5 或 +5.4 倍標(biāo)準(zhǔn)差),則所觀測(cè)到的空間模式可能過(guò)于罕見(jiàn),不可能是隨機(jī)過(guò)程產(chǎn)生的結(jié)果,而且 p 值很小也可以反映出這一點(diǎn)。在這種情況下,可以拒絕零假設(shè),并著手找出是什么可能導(dǎo)致您的數(shù)據(jù)出現(xiàn)具有統(tǒng)計(jì)顯著性的空間結(jié)構(gòu)。
這里的一個(gè)關(guān)鍵概念是,正態(tài)分布中間位置的值(例如,類似 0.19 或 -1.2 的 z 得分)代表了預(yù)期的結(jié)果。但在 z 得分的絕對(duì)值很大而概率很小時(shí)(即出現(xiàn)在正態(tài)分布的兩端),您就會(huì)查看其中存在的不尋?,F(xiàn)象并且這也非常有趣。例如,對(duì)于熱點(diǎn)分析工具,不尋常意味著出現(xiàn)了具有統(tǒng)計(jì)顯著性的熱點(diǎn)或冷點(diǎn)。
(z 得分越高(或越低),聚類程度就越高。如果 z 得分接近零,則表示研究區(qū)域內(nèi)不存在明顯的聚類。z 得分為正表示高值的聚類。z 得分為負(fù)表示低值的聚類。)
因此,其實(shí)上面這張圖下面的那句話其實(shí)就是給我們的解釋,“隨機(jī)產(chǎn)生此聚類模式的可能性小于1%”,也就是說(shuō),我們的數(shù)據(jù)是聚類的,因?yàn)殡S機(jī)的可能性是1%,也就是99%的把握認(rèn)為我們的數(shù)據(jù)是聚類的,也就是湖南省122個(gè)縣的GDP在空間上是有關(guān)聯(lián)的,并且是聚類分布的。
其實(shí)莫蘭指數(shù)也就只能告訴我們這么多了,它并不會(huì)返回一張紅藍(lán)相間的圖給我們,那是其他的工具如局部莫蘭指數(shù)或者熱點(diǎn)分析會(huì)返回的圖,因此全局莫蘭指數(shù)是作為一個(gè)檢驗(yàn)數(shù)據(jù)的空間相關(guān)性的工具出現(xiàn)的,但是也是必不可少的,當(dāng)然了,雖然不能出圖,但是在我們的論文里,是可以將這個(gè)結(jié)果作為結(jié)論出現(xiàn)的?。?/p>
本文鏈接:http://m.dzac.com.cn/blog/382.html
本文標(biāo)簽:ArcGIS