区域分析热势法的技术实现

区域分析热势法的技术实现

在第一份出版物中(使用热势进行区域分析)我们描述了如何使用热势来分析一般区域。 在接下来的出版物中,计划描述有关空间对象的信息如何存储在数据库中、如何构建主要组件的模型以及通常可以执行哪些区域分析任务。 但首先要说的是。

首先使用热势法可以大致了解我们感兴趣的区域。 例如,从OSM获取巴塞罗那(加泰罗尼亚)市的初始信息,在不选择参数的情况下进行积分分析,我们可以获得第一主成分的“热”图像。 我们还在第一篇文章中讨论了“热”图,但回想一下术语“热”图是由于积分分析中使用的势的物理意义而产生的,这不会有错。 那些。 在物理问题中,势是温度,而在地域分析问题中,势是所有影响因素对地域上特定点的总影响。

下面是通过积分分析获得的巴塞罗那市“热”图的示例。

区域分析热势法的技术实现
第一主成分“热”图,无参数选择,巴塞罗那

通过设置特定的参数(在本例中,我们选择行业),您可以直接获得其“热”图。

区域分析热势法的技术实现
第一主成分热图,工业,巴塞罗那

当然,分析的问题比获得对选定区域的总体评估要广泛得多,也更加多样化,因此,作为一个例子,在本文中,我们将考虑在放置新对象时找到最佳位置的问题以及技术实施热势法来解决这个问题,在未来的出版物中我们将研究其他方法。

解决放置新物体时找到最佳位置的问题将有助于确定该领土接受该新物体的“准备程度”,它将如何与该领土中现有的其他物体相关联,该新物体的价值有多大领土以及它将增加什么价值。

技术实施阶段

技术实现可以用下面列出的过程序列来表示:

  1. 准备信息环境。
  2. 源信息的搜索、收集和处理。
  3. 在分析区域构建节点网格。
  4. 将地域因素分解成碎片。
  5. 根据因素计算潜力。
  6. 选择创造地域整体主题特征的因素。
  7. 应用主成分法获取领土积分指标。
  8. 创建用于选择新设施建设地点的模型。

阶段1。 准备信息环境

在这个阶段,需要选择数据库管理系统(DBMS),确定信息来源、收集信息的方法以及收集的信息量。
在我们的工作中,我们使用了 PostgeSql 数据库 (DB),但值得注意的是,任何其他支持 SQL 查询的数据库都可以。

数据库将存储初始信息 - 关于对象的空间数据:数据类型(点、线、多边形)、它们的坐标和其他特征(长度、面积、数量),以及作为结果获得的所有计算值所开展的工作以及工作本身的结果。

统计信息也以空间数据的形式呈现(例如,具有分配给这些区域的统计数据的区域的区域)。

通过对收集到的初始信息进行转换和处理,形成包含有关线性、点和面积因子及其标识符和坐标的信息的表格。

第二阶段。 源信息的搜索、收集和处理

作为解决此问题的初始信息,我们使用来自开放地图源的信息,其中包含有关领土的信息。 我们认为,领先者是 OSM 信息,每天在世界各地更新。 但是,如果您设法从其他来源收集信息,情况也不会更糟。
信息处理包括使其统一、消除虚假信息并准备将其加载到数据库中。

第三阶段。 在分析区域构建节点网格

为了保证分析区域的连续性,需要在其上构建网格,网格的节点在给定的坐标系中具有坐标。 随后将确定每个网格节点的潜在值。 这将使您能够可视化同质区域、聚类和最终分析结果。

根据要解决的任务,可以使用两种构建网格的选项:
— 具有常规步长的网格 (S1) – 在整个领土上都可以观察到。 用于计算各因素的潜力,确定地域(主要成分和集群)的整体特征并显示建模结果。

选择此网格时,您必须指定:

  • 网格间距 – 网格节点所在的间隔;
  • 分析领土的边界,可能对应于行政区域划分,也可能是地图上以多边形形式限制计算区域的区域。

— 不规则间距的网格 (S2) 描述区域的各个点(例如质心)。 它还用于计算因素的潜力,并确定领土的整体特征(主要组成部分和集群)。 在不规则步长网格上精确进行计算主成分建模,为了使模拟结果可视化,根据坐标邻近原则将不规则步长网格节点的簇数转移到规则步长网格节点。
在数据库中,有关网格节点坐标的信息以表格的形式存储,其中包含每个节点的以下信息:

  • 节点ID;
  • 节点坐标(x,y)。

下图显示了针对不同区域具有不同间距的规则间距网格示例。

区域分析热势法的技术实现

区域分析热势法的技术实现
下诺夫哥罗德的覆盖网格(红点)。 下诺夫哥罗德地区的覆盖网格(蓝点)。

第四阶段将地域因素分解成碎片

为了进一步分析,必须将区域的扩展因子转换为离散因子数组,以便每个网格节点包含有关其中存在的每个因子的信息。 线性因素分为片段,面积因素分为片段。

根据地域面积和具体因素选择划分步长;对于大的区域(地区),划分步长可以为100-150 m;对于较小的区域(城市),划分步长可以为25-50 m 。

在数据库中,有关拆分结果的信息以表的形式存储,其中包含每个分片的以下信息:

  • 因素标识符;
  • 所得分区片段的质心坐标 (x, y);
  • 分区片段的长度/面积。

第五阶段根据因素计算潜力

分析初始信息的一种可能且易于理解的方法是将因素视为影响对象的潜力。

让我们使用二维情况下拉普拉斯方程的基本解——到点的距离的对数。

考虑到零时电势值有限的要求和远距离电势值的限制,电势确定如下:

区域分析热势法的技术实现 在 r (1)

区域分析热势法的技术实现 对于 r2>r>=r1

区域分析热势法的技术实现 对于 r>=r2

区域分析热势法的技术实现
点对象的影响潜力类型

对数函数必须以零为界,并且在距因子一定距离处合理地有界。 如果我们不对远离因子的势进行限制,那么我们将不得不考虑远离分析点的大量信息,这对分析几乎没有影响。 因此,我们引入因子作用半径的值,超过该值,因子对势的贡献为零。

对于城市,假设因子的半径等于半小时 行人 可达性 - 2 米。 对于该地区,我们应该讨论半个小时 运输 可达性 - 20 米。

因此,作为计算潜力值的结果,我们得到了规则网格每个节点处每个因素的总潜力。

第六阶段。 塑造地域整体主题特征的因素选择

在此阶段,选择最重要和信息最丰富的因素来创建该地区的主题整体特征。

因素的选择可以通过为参数设置一定的边界(相关性、影响百分比等)来自动进行,也可以通过了解问题的主题并对领域有一定的了解来熟练地完成。

选择最重要和信息最丰富的因素后,您可以继续进行下一步 - 主要组成部分的解释。

第7阶段应用主成分法获取领土积分指标。 聚类

有关领土因素的初始信息在前一阶段转换为针对每个网格节点计算的潜力,并组合成新的积分指标 - 主要成分。

主成分法分析研究区域内因素的变异性,并根据分析结果找到其变化最大的线性组合,从而可以计算其变化的度量 - 在区域内的分散度。

让我们以一个一般问题来创建一个模型,将线性模型函数逼近给定值
区域分析热势法的技术实现 (2)
其中 i 是组件编号,
n – 参与计算的组件数量
j – 领土点的节点索引,j=1..k
k – 进行主要成分计算的领土网格的所有节点的数量
区域分析热势法的技术实现 — 模型第 i 个主要成分的系数
区域分析热势法的技术实现 – 第 j 个点的第 i 个主成分的值
B——模型的自由项
区域分析热势法的技术实现 — 我们正在为其构建模型的因子的第 j 个点的潜力

让我们确定方程中的未知数 (2) 最小二乘法,利用主成分的性质:
区域分析热势法的技术实现 (3)
其中 i 和 i2 是组件编号,i<>i2
j——地域节点索引
k是所有领土节点的数量
区域分析热势法的技术实现 (4)

(3) 表示成分之间不存在相关性
(4) – 任何成分的总值为零。

我们得到:
区域分析热势法的技术实现
区域分析热势法的技术实现 (5)
这里的符号与等式中的相同。 (2), 区域分析热势法的技术实现 表示平均潜力值

该结果可以解释如下:
该模型是一个简单的表达式,由模拟值的平均值和每个分量的简单修正组成。 结果至少必须包括虚拟项 B 和第一主成分。 以下是下诺夫哥罗德地区第一主成分的热图示例。

区域分析热势法的技术实现

区域分析热势法的技术实现

基于计算的主成分,可以构建均匀区域。 这既可以针对所有参数执行,也可以仅针对定价参数执行 - 即进行聚类。 为此,您可以使用 K均值法。 对于每个同质区域,计算第一主成分的平均值,表征该地区的发展水平。
下面给出了下诺夫哥罗德地区按定价参数进行聚类的示例。

区域分析热势法的技术实现

此外,利用获得的主成分作为成本模型的参数,我们可以获得该地区的价格面。

区域分析热势法的技术实现
下诺夫哥罗德 价格面

第 8 阶段。 创建用于选择新设施建设地点的模型

要为新物体(以下简称“物体”)的位置选择最有吸引力的地方,需要将“物体”的位置与周围的基础设施进行比较。 “客体”要发挥作用,必须有足够的资源来保证其发挥作用;必须考虑到大量因素,包括对“客体”的正面和负面影响。 所有这些因素都可以被定义为“物体”功能的“营养”环境。 物体数量与领土资源数量的对应关系是“物体”稳定运行的基础。

比较的结果是计算区域每个点的潜力,并允许对放置新“对象”的位置选择进行视觉和分析分析。

例如,对于贸易而言,买家的持续流动非常重要,这意味着贸易对象必须考虑的因素清单还应包括确保这种流动的因素(例如,社会基础设施、工作地点、居住地点、交通路线等)。

另一方面,当满足确保零售设施运转的所有条件时,有必要考虑零售设施的密度,因为环境的“消耗”导致购买可能性的下降。 人的流动不是无限的,财力、体力也是如此。

解决为对象选择最佳位置问题的算法归结为以下事实:作为主要组件的函数获得的势尽可能接近“对象”类型的一组对象的势; 然后计算模型的电势与“对象”类型的对象的电势之间的差异; 从所得差值中减去一个“物体”的贡献潜力值; 在这种情况下获得的负值被零替换,即那些没有足够资源用于新“对象”运行的地方被消除。

由于采取的行动,我们获得了具有正潜在价值的领土点,即我们的“对象”的有利位置的地方。

换句话说,我们计算出所有可用因素的潜力,以及我们想要为其构建模型并分析所选主题领域(贸易、工业、文化、社会领域等)的因素。

为此,需要选择构建环境变量的因素(主要成分),然后基于它们计算模型。
我们建议通过分析所有因素与主题区域参考因素的相关性来选择因素。 例如,对于文化来说,可以是剧院,对于教育系统来说,可以是学校等。

我们计算标准潜力与所有因素潜力的相关性。 我们选择那些相关系数大小大于某个值的因素(通常取最小相关系数=0)。
区域分析热势法的技术实现 (6)
哪里 区域分析热势法的技术实现 ——第i个因子与标准的相关系数的绝对值。

相关性是在覆盖该地区的所有网格节点上计算的。

模型的电势与方程中与新对象相同类型的对象的电势之间的差异 (2) 显示了该地区的潜力,可用于寻找新设施。

由此,我们得到了潜在价值,它表征了“对象”在研究区域的位置的受益程度。

下面给出了如何以图形方式显示新“对象”的推荐位置的示例。

区域分析热势法的技术实现

因此,解决为新对象选择最佳位置问题的结果可以表示为对每个点的领土的评估,给出了定位投资对象的潜力的想法,即越高得分越高,定位对象的利润就越高。

总之,值得一提的是,在本文中,我们只考虑了一个可以使用领土分析解决的问题,即现有的开源数据。 事实上,有很多问题都可以在它的帮助下解决,它们的数量仅受您的想象力的限制。

来源: habr.com

添加评论