使用热势进行区域分析

使用热势进行区域分析
计算下诺夫哥罗德街道网络热势的示例

城市版图是一个复杂、异质的系统,处于不断变化之中。 您可以使用空间对象(因素)描述领土并评估城市环境。 描述领土的因素在其影响性质(正面、负面)和几何配置(点、线、多边形)方面有所不同。

通常很难确定每个单独对象对整个领土或其任何特定方面的发展水平的影响程度。 如今,定义和描述“文化”、“社会领域”、“社会紧张”、“美好生活”、“经济发展”、“人口健康”等概念的问题变得越来越重要。 如果我们想将这些概念应用于不同的社会群体、不同年龄和性别的人群,这些概念的模糊性就会增加。

另外,值得注意的是,现代概念中城市的边界是相当任意的。 每天的人口迁移、偏远地区的交通不便,让城市的边界更加“模糊”。 现在广泛使用的城市群概念,总体上反映了城市的边界,但同时也使城市边界的概念变得更加模糊。

尽管存在上述问题,当今对领土的分析和评估是最有前途和最有趣的领域之一,可以解决城市环境的许多紧迫问题。

本文提出了一种使用“热”模型分析领土的方法供考虑。 该方法基于对各种性质(点、线性和面积)的物体(因素)产生的势的研究。 使用这种方法对领土进行分析可以从描述领土的一组空间数据(因素)转变为领土每个点的准确数值(分数)评估。

作为区域分析的一部分所研究的势具有物理解释 - 不同维度(2D、3D)环境中的热传播。 这种现象可以以“热”图像(领土的“热”图)的形式表示,根据图像的颜色强度来了解领土的发展程度。

地域因素

地域分析涉及搜索和处理有关影响地域的因素及其指标的信息。 影响因素是影响周围地域并具有一组特征和空间坐标的对象。 影响因素的例子包括商店、工业设施、道路、森林和水体。

影响力指标是对象 反光的 物体的影响,并且还具有一组特征和空间坐标。 影响力指标的示例:ATM、广告牌、纪念碑。

在下面的演示中,我们将使用影响因素的概念,它结合了影响因素和影响指标这两个术语。

以下是作为影响因素的空间数据的示例。

使用热势进行区域分析

开展领土分析工作的重要阶段之一是收集和处理初始信息的阶段。 如今,有大量关于影响领土的因素的不同程度的详细信息。

信息可以从公开来源或受限来源获得。 在许多情况下,开放信息足以进行分析,尽管通常需要相当劳动密集型的处理。

我们认为,在开源中,领先者是资源 OpenStreetMap (OSM)。 从该来源获得的信息每天都会在世界各地更新。

OpenStreetMap (OSM) 资源信息以以下格式呈现:

- OSM 格式。 扩展名为“.osm”的主要格式用于描述 XML 图形图像——节点、路径、关系。

- “波兰语格式”。 扩展名为“.mp”的文本格式用于处理图形。

-PBF 格式。 数据存储格式,扩展名为“.osm.pbf”。

您还可以使用以下信息作为信息来源:

- 2 地理信息系统
该资源包含高质量的每月处理信息,并为企业和组织提供出色的三级分类器。

- KML(锁孔标记语言)文件
KML(Keyhole 标记语言)文件是一种文件格式,用于在 Google 地球、Google 地图和移动设备 Google 地图中显示地理数据。

使用 KML 文件,您可以:
- 安装各种图标并制作签名来指示地球表面的位置
— 通过改变相机位置为选定的对象创建不同的角度
- 使用不同的叠加图像
— 定义样式来自定义对象的显示,应用 HTML 代码来创建超链接和内嵌图像
— 使用文件夹对元素进行分层分组
— 从远程或本地网络节点动态接收和更新 KML 文件
- 根据XNUMXD查看器的变化接收KML数据

- 联邦国家登记、地籍和制图服务局“Rosreestr”
Rosreestr 门户上的信息因其内容和相关性而很有价值,但不幸的是,它无法免费获取基本建设项目和土地的图形。 Rosreestr 门户还包含大量限制访问信息。

- 统计机构
统计数据是有关领土的合法信息来源,但是,截至目前,统计机构的数据仅适用于某些指标,主要是在统计机构的报告和地区当局的报告中。

- 当局信息系统
政府信息系统中包含高质量信息,但只有一小部分信息在公共领域发布并可供分析。

对领土进行分析并不对信息的构成提出任何具体要求;事实上,您可以使用找到的所有内容;来自开源的信息通常是可以互换的。 然而,应该指出的是,即使仅从 OSM 资源收到的信息也足以对不熟悉的领域进行分析。

使用“热”模型分析领土。 势的物理解释

如前所述,领土分析是当今的热门话题,也是合理吸引各种城市环境基础设施发展投资的有力工具。

使用地域分析解决的各种问题可以分为几个主要领域:

— 获得对每个点的领土最可解释和详细的评估。
通过解决问题,您可以获得领土每个点的一组点,从而了解该领土的总体发展水平以及某个主题领域的发展水平。 例如,这样的主题领域可以是文化、工业、贸易等。

——确定选定区域内最有利于放置某种类型投资对象(例如银行、专卖店、购物娱乐中心等)的地点。

— 领土最有效利用的分析。
该方向可以详细研究该地区的特征、所研究地区发展的市场状况以及流行选择的识别。

— 以新道路和新路线的出现为例,确定某一因素对成本模型的贡献。

— 对一个领土的不同方面进行分析,并对不同领土进行分析(领土比较)。

文中提出的利用“热力”模型进行地域分析的方法的独创性在于采用了地域发展指标——潜力,以数值的形式呈现,反映了对象(影响因素)对地域的影响程度。

要理解这项研究的本质,有必要简单介绍一下热势本身并给出其物理解释。

物理学中有这样的概念 力场 и 力函数。 力场具有能量的量纲,力函数具有力的量纲。

对于万有引力定律,力场由以下公式定义:

F=k/r2,其中
k——常数;
r——交互对象之间的距离。

力函数 phi 由以下表达式确定:

dψ=-F*dr,其中
ψ——力场势;
dphi, dr——微分;
r 是相互作用对象之间的距离,

因此 ψ=k/r。

力场势 ψ 的物理意义是力场通过一定路径时所做的功 E。 在万有引力定律的情况下,当到物体的距离从r2变化到r1时,力函数由以下公式确定

E=k*(1/r1-1/r2),其中
E是力场经过一定路径时所做的功;
r1、r2 – 对象的初始和最终位置。

对于分析地域的任务,物体(因素)对地域的影响可以被视为一种力(幂函数),以及领土的发展水平作为总热潜力(力场)来自所有对象(因素)。 在物理问题中,热势就是温度,而在使用“热”模型的地域分析问题中,热势代表了所有影响因素对地域中某一点的影响总和。

空间数据由点、线和多边形组成。 为了计算势,扩展的空间数据被分成小片段。 对于每个片段,使用等于对象片段大小(因子)的乘数来计算该点的电势。

根据紧密相似性原则将数据划分为语义组。 例如,贸易对象按产品组合。 有森林物体群、水体、聚落、交通站点等。 通过意义联合起来的群体代表了一个因素。 经过所有对象(因素)后,我们获得了一组适合进一步处理的热势。

使用势(“热图”)可以让您从空间数据转移到影响区域的对象(因素)的“热”图像(势的可视化)。 这种转变使得可以确定该因素在领土每个点的存在程度并进行进一步的分析,即用色彩展现城市发展的不同方向。 因此,我们获得了区域每个点的不同强度的发光。

下面介绍了在多种因素的背景下下诺夫哥罗德地区的“热”图像示例。

使用热势进行区域分析
下诺夫哥罗德“热力”地图,体现“药房连锁”因素

使用热势进行区域分析
下诺夫哥罗德的“热度”地图,反映了“成人综合诊所”因素

使用热势进行区域分析
下诺夫哥罗德“热”地图,反映“儿童诊所”因素

使用热势进行区域分析
下诺夫哥罗德的“热”地图,反映了“工业区”因素

区域的“热”图像可以确定各种影响对象的电势集中度。 接下来,有必要将获得的潜力结合成一个整体特征,以便根据大量因素对领土进行评估。 这就需要一种方法,可以让你分析大量的信息,识别物体,同时还能降低数据的维度,损失最少的信息。 其中一种方法是主成分分析 (PCA)。 有关此方法的更多详细信息可以在 维基百科.

该方法的本质是找到分析区域中变化最强烈的初始参数的线性组合。 对于空间数据——领土上变化最强烈的数据。

主成分法识别区域内变化最强烈的对象(因素)。 该方法的结果是,出现了新的变量 - 主要成分,与原始数据相比,它们提供了更多信息,借助它,可以更轻松地分析、描述和可视化领土,并更容易在其上构建模型。

主成分是解析表达式 - 具有特定系数的初始因子的势之和。 然而,如果某个因素对地域有显着影响,但在分析的地域范围内没有发生变化,则主成分法不会将该因素纳入主成分的构成中。

主要组成部分按信息降序排列 - 即遍布全境。 第一个主成分比单个因素携带更多的信息,并且很好地描述了该领域。 通常,当使用大约一百个因子时,第一个主成分包含该区域所有信息(方差)的大约 50%。 主成分彼此不相关,可用于模型作为每个点的领土特征。

主要成分作为领土的某种抽象计算指标,没有明确的名称和分类。 然而,一组与主要成分密切相关的因素使我们能够解释主要成分。 一般来说,以下因素与主要成分相关:

——基础设施发展水平;
— 领土的交通组成部分;
——气候带;
——农业发展水平;
— 该领土的经济潜力。

对前几个重要的主成分进行进一步的分析,包括聚类。

在图中,您可以看到俄罗斯联邦几个城市境内第一个主要组成部分的图形表示。

使用热势进行区域分析
表征下诺夫哥罗德城市基础设施发展水平的第一个主要组成部分

使用热势进行区域分析
表征叶卡捷琳堡城市基础设施发展水平的第一个主要组成部分

使用热势进行区域分析
表征喀山城市基础设施发展水平的第一个主要组成部分

使用热势进行区域分析
表征彼尔姆城市基础设施发展水平的第一个主要组成部分

使用热势进行区域分析
第一个主要组成部分表征萨马拉城市基础设施的发展水平

使用热势进行区域分析
表征哈巴罗夫斯克城市基础设施发展水平的第一个主要组成部分

整体特征:聚类

地域分析工作的下一步是寻找质量同质的城市环境区域。 此搜索基于对领土内每个点的主成分值的分析。 搜索这些同质区域的问题可以使用聚类来解决——基于一组特征的邻近原则对区域进行分组的过程。

区域聚类有两个目标:

— 创造更好的领土可视化效果;
— 分配各个模型编译的区域。

根据选定的分析因素对区域进行聚类。 这些因素可能是影响定价的因素,也可能是描述领土发展某些方面的因素,例如社会领域。

常见的经典聚类方法有两种:K-means方法和树状图方法。 在处理区域时,K-means方法已经证明了自己的能力,其特点是通过向增长点添加新对象来“增长”集群。 K-means方法的优点在于其工作与领域形成的自然过程相似:整合相似的,而不是分离不相似的。

K-means 方法用于下诺夫哥罗德的计算(下图)。

使用热势进行区域分析
以下诺夫哥罗德为例,集群与地区发展水平的一致性

通过所提出的方法,可以获得该领域各个主题的概况。 例如,我们感兴趣的话题可能是城市基础设施的发展水平、领土的“精英”水平、文化发展水平、领土发展的社会组成部分。 这些主题是定义不明确的整体概念,由许多相互关联的因素组成。

使用某种算法来选择分析参数(包括专家的参与),我们将获得专题地图,该地图可以了解该地区发展的一个方面。

整体特征被理解为第一主成分,主要是信息最丰富的第一主成分,以及根据选定参数的区域聚类。

下图展示了发展各个方面的第一个主要组成部分的专题图。

使用热势进行区域分析
以下诺夫哥罗德为例的专题地图“文化对象”

使用热势进行区域分析
以下诺夫哥罗德为例的专题地图“社会领域”

整体特征使得可以利用许多因素来了解一个领土的特征,同时将信息损失降至最低。

总之,再次值得注意的是,今天,地域分析是解决城市环境发展、选择投资建设地点、寻找新设施最有利位置等任务的极其重要的阶段。

文章中提出的使用来自不同性质因素的“热”模型的地域分析方法对于因素集并不重要,即它不对初始信息施加限制或要求。

源信息的多样性和冗余性以及使用开放数据的机会提供了 分析任何领域的无限前景 的世界。

在以下专门讨论地域分析问题的出版物中,我们计划揭示使用主成分编译模型的特征以及用于执行以下任务的方法:

— 放置新物体时选择最佳位置;
— 使用市场价值构建某类物品的价格面;
- 根据对象的位置评估某种类型活动的盈利能力。

还计划提出从主成分到因子的反向转换方法,这反过来又使得从给定区域的因子获得模型成为可能。

来源: habr.com

添加评论