區域分析熱勢法的技術實現

區域分析熱勢法的技術實現

在第一份出版品(使用熱勢進行區域分析)我們描述如何使用熱勢來分析一般區域。在接下來的出版物中,計劃描述有關空間物件的資訊如何儲存在資料庫中、如何建立主要組件的模型以及通常可以執行哪些區域分析任務。但首先要說的是。

首先使用熱勢法可以大致了解我們感興趣的區域。例如,從OSM獲取巴塞隆納(加泰隆尼亞)市的初始信息,在不選擇參數的情況下進行積分分析,我們可以獲得第一主成分的「熱」影像。我們也在第一篇文章中討論了「熱」圖,但回想一下術語「熱」圖是由於積分分析中使用的勢的物理意義而產生的,這不會有錯。那些。在物理問題中,位勢是溫度,而在地域分析問題中,位勢是所有影響因素對地域上特定點的總影響。

以下是透過積分分析獲得的巴塞隆納市「熱」圖的範例。

區域分析熱勢法的技術實現
第一主成分的「熱」圖,無參數選擇,巴塞隆納

透過設定特定的參數(在本例中,我們選擇行業),您可以直接獲得其「熱」圖。

區域分析熱勢法的技術實現
第一主成分熱圖,工業,巴塞隆納

當然,分析的問題比獲得對選定區域的總體評估要廣泛得多,也更加多樣化,因此,作為一個例子,在本文中,我們將考慮在放置新物件時找到最佳位置的問題以及技術實施熱勢法來解決這個問題,在未來的出版物中我們將研究其他方法。

解決放置新物體時找到最佳位置的問題將有助於確定該領土接受該新物體的“準備程度”,它將如何與該領土中現有的其他物體相關聯,該新物體的價值有多大領土以及它將增加什麼價值。

技術實施階段

技術實作可以用下面列出的過程序列來表示:

  1. 準備資訊環境。
  2. 來源資訊的搜尋、收集和處理。
  3. 在分析區域建構節點網格。
  4. 將地域因素分解成碎片。
  5. 根據因素計算潛力。
  6. 選擇創造地域整體主題特徵的因素。
  7. 應用主成分法取得領土積分指標。
  8. 建立用於選擇新設施建設地點的模型。

階段1。準備資訊環境

在這個階段,需要選擇資料庫管理系統(DBMS),確定資訊來源、收集資訊的方法以及收集的資訊量。
在我們的工作中,我們使用了 PostgeSql 資料庫 (DB),但值得注意的是,任何其他支援 SQL 查詢的資料庫都可以。

資料庫將儲存初始資訊 - 關於物件的空間資料:資料類型(點、線、多邊形)、它們的座標和其他特徵(長度、面積、數量),以及作為結果獲得的所有計算值所開展的工作以及工作本身的結果。

統計資料也以空間資料的形式呈現(例如,具有分配給這些區域的統計資料的區域的區域)。

透過對收集到的初始資訊進行轉換和處理,形成包含有關線性、點和麵積因子及其標識符和座標的資訊的表格。

第二階段來源資訊的搜尋、收集和處理

作為解決此問題的初始信息,我們使用來自開放地圖源的信息,其中包含有關領土的信息。我們認為,領先者是 OSM 訊息,每天在世界各地更新。但是,如果您設法從其他來源收集信息,情況不會更糟。
資訊處理包括使其統一、消除虛假資訊並準備將其載入資料庫。

第三階段。在分析區域建構節點網格

為了確保分析區域的連續性,需要在其上建立網格,網格的節點在給定的座標系中具有座標。隨後將確定每個網格節點的潛在值。這將使您能夠視覺化同質區域、聚類和最終分析結果。

根據要解決的任務,可以使用兩種建立網格的選項:
— 具有常規步長的網格 (S1) – 在整個領土上都可以觀察到。用於計算各因素的潛力,確定地域(主要成分和集群)的整體特徵並顯示建模結果。

選擇此網格時,您必須指定:

  • 網格間距 – 網格節點所在的間隔;
  • 分析領土的邊界,可能對應於行政區域劃分,也可能是地圖上以多邊形形式限制計算區域的區域。

— 不規則間距的網格 (S2) 描述區域的各點(例如質心)。它也用於計算因素的潛力,並確定領土的整體特徵(主要組成部分和集群)。在不規則步長網格上精確進行計算主成分建模,為了使模擬結果視覺化,根據座標鄰近原則將不規則步長網格節點的簇數轉移到規則步長網格節點。
在資料庫中,有關網格節點座標的資訊以表格的形式存儲,其中包含每個節點的以下資訊:

  • 節點ID;
  • 節點座標(x,y)。

下圖顯示了針對不同區域具有不同間距的規則間距網格範例。

區域分析熱勢法的技術實現

區域分析熱勢法的技術實現
下諾夫哥羅德的覆蓋網格(紅點)。下諾夫哥羅德地區的覆蓋網格(藍點)。

第四階段將地域因素分解成碎片

為了進一步分析,必須將區域的擴展因子轉換為離散因子數組,以便每個網格節點包含有關其中存在的每個因子的資訊。線性因素分為片段,面積因素分為片段。

根據地域面積和具體因素選擇劃分步長;對於大的區域(地區),劃分步長可以為100-150 m;對於較小的區域(城市),劃分步長可以為25-50 m 。

在資料庫中,有關拆分結果的資訊以表格的形式存儲,其中包含每個分片的以下資訊:

  • 因素標識符;
  • 所得分區片段的質心座標 (x, y);
  • 分區片段的長度/面積。

第五階段根據因素計算潛力

分析初始資訊的一種可能且易於理解的方法是將因素視為影響對象的潛力。

讓我們使用二維情況下拉普拉斯方程式的基本解——到點的距離的對數。

考慮到零時電位值有限的要求和遠距離電位值的限制,電位確定如下:

區域分析熱勢法的技術實現 對於 r<r1 (1)

區域分析熱勢法的技術實現 對於 r2>r>=r1

區域分析熱勢法的技術實現 對於 r>=r2

區域分析熱勢法的技術實現
點對象的影響潛力類型

對數函數必須以零為界,並且在距因子一定距離處合理地有界。如果我們不對遠離因子的勢進行限制,那麼我們將不得不考慮遠離分析點的大量信息,這對分析幾乎沒有影響。因此,我們引入因子作用半徑的值,超過該值,因子對勢的貢獻為零。

對於城市,假設因子的半徑等於半小時 行人 可達性 - 2 公尺。對於該地區,我們應該討論半小時 運輸 可達性 - 20 公尺。

因此,作為計算潛力值的結果,我們得到了規則網格每個節點處每個因素的總潛力。

第六階段。塑造地域整體主題特徵的因素選擇

在此階段,選擇最重要和資訊最豐富的因素來創建該地區的主題整體特徵。

因素的選擇可以透過為參數設定一定的邊界(相關性、影響百分比等)來自動進行,也可以透過了解問題的主題並對領域有一定的了解來熟練地完成。

選擇最重要和資訊最豐富的因素後,您可以繼續進行下一步 - 主要組成部分的解釋。

第7階段應用主成分法取得領土積分指標。聚類

關於領土因素的初始信息,在前一階段轉換為針對每個網格節點計算的潛力,被組合成新的積分指標——主要成分。

主成分法分析研究區域內因素的變異性,並根據分析結果找到其變化最大的線性組合,從而可以計算其變化的度量 - 在區域內的分散度。

讓我們以一個一般問題來建立一個模型,將線性模型函數逼近給定值
區域分析熱勢法的技術實現 (2)
其中 i 是組件編號,
n – 參與計算的組件數量
j – 領土點的節點索引,j=1..k
k – 進行主要成分計算的領土網格的所有節點的數量
區域分析熱勢法的技術實現 — 模型第 i 個主要成分的係數
區域分析熱勢法的技術實現 – 第 j 個點的第 i 個主成分的值
B-模型的自由項
區域分析熱勢法的技術實現 — 我們正在為其建立模型的因子的第 j 個點的潛力

讓我們確定方程中的未知數 (2) 最小平方法,利用主成分的性質:
區域分析熱勢法的技術實現 (3)
其中 i 和 i2 是組件編號,i<>i2
j - 領土節點索引
k是所有領土節點的數量
區域分析熱勢法的技術實現 (4)

(3) 表示成分間不存在相關性
(4) – 任何成分的總值為零。

我們得到:
區域分析熱勢法的技術實現
區域分析熱勢法的技術實現 (5)
這裡的符號與等式中的相同。 (2), 區域分析熱勢法的技術實現 表示平均潛力值

該結果可以解釋如下:
這個模型是一個簡單的表達式,由模擬值的平均值和每個分量的簡單修正組成。結果至少必須包括虛擬項 B 和第一主成分。以下是下諾夫哥羅德地區第一主成分的熱圖範例。

區域分析熱勢法的技術實現

區域分析熱勢法的技術實現

基於計算的主成分,可以建構均勻區域。這既可以針對所有參數執行,也可以僅針對定價參數執行 - 即進行聚類。為此,您可以使用 K均值法。對於每個同質區域,計算第一主成分的平均值,以表徵該地區的發展程度。
下面給出了下諾夫哥羅德地區按定價參數進行聚類的範例。

區域分析熱勢法的技術實現

此外,利用所得的主成分作為成本模型的參數,我們可以獲得該地區的價格面。

區域分析熱勢法的技術實現
下諾夫哥羅德 價格面

第 8 階段。建立用於選擇新設施建設地點的模型

要為新物體(以下簡稱「物體」)的位置選擇最有吸引力的地方,需要將「物體」的位置與周圍的基礎設施進行比較。 「客體」要發揮作用,必須有足夠的資源來保證其發揮作用;必須考慮到大量因素,包括對「客體」的正面和負面影響。所有這些因素都可以被定義為「物體」功能的「營養」環境。物體數量與領土資源數量的對應關係是「物體」穩定運作的基礎。

比較的結果是計算區域每個點的潛力,並允許對放置新「物件」的位置選擇進行視覺和分析分析。

例如,對於貿易而言,買家的持續流動非常重要,這意味著貿易對象必須考慮的因素清單還應包括確保這種流動的因素(例如,社會基礎設施、工作地點、居住地點、交通路線等)。

另一方面,當滿足確保零售設施運作的所有條件時,有必要考慮零售設施的密度,因為環境的「消耗」導致購買可能性的下降。人的流動不是無限的,財力、體力也是。

解決為物件選擇最佳位置問題的演算法歸結為以下事實:作為主要組件的函數獲得的勢盡可能接近「物件」類型的一組物件的勢;然後計算模型的電位與「物件」類型的物件的電位之間的差異;從所得差值中減去一個「物體」的貢獻潛力值;在這種情況下獲得的負值被零替換,即那些沒有足夠資源用於新「物件」運作的地方被消除。

由於採取的行動,我們獲得了具有正潛在價值的領土點,即我們的「物件」的有利位置的地方。

換句話說,我們計算出所有可用因素的潛力,以及我們想要為其建立模型並分析所選主題領域(貿易、工業、文化、社會領域等)的因素。

為此,需要選擇建立環境變數的因素(主要成分),然後基於它們計算模型。
我們建議透過分析所有因素與主題區域參考因素的相關性來選擇因素。例如,對於文化來說,可以是劇院,對於教育系統來說,可以是學校等。

我們計算標準潛力與所有因素潛力的相關性。我們選擇那些相關係數大小大於某個值的因素(通常取最小相關係數=0)。
區域分析熱勢法的技術實現 (6)
哪裡 區域分析熱勢法的技術實現 ——第i個因子與標準的相關係數的絕對值。

相關性是在覆蓋該地區的所有網格節點上計算的。

模型的電位與方程中與新物件相同類型的物件的電位之間的差異 (2) 顯示了該地區的潛力,可用於尋找新設施。

由此,我們得到了潛在價值,它表徵了「物件」在研究區域的位置的受益程度。

下面給出瞭如何以圖形方式顯示新「物件」的建議位置的範例。

區域分析熱勢法的技術實現

因此,解決為新物件選擇最佳位置問題的結果可以表示為對每個點的領土的評估,給出了定位投資對象的潛力的想法,即越高得分越高,定位對象的利潤就越高。

總之,值得一提的是,在本文中,我們只考慮了一個可以使用領土分析來解決的問題,即現有的開源資料。事實上,有很多問題都可以在它的幫助下解決,它們的數量僅受您的想像的限制。

來源: www.habr.com

添加評論