ProHoster > Блог > Новости интернета > Составление рейтинга территорий методом тепловых потенциалов с использованием открытых данных
Составление рейтинга территорий методом тепловых потенциалов с использованием открытых данных
В данной статье рассмотрим алгоритм и результаты анализа территорий большой площади без ограничения на их границах, с использованием метода тепловых потенциалов и метода главных компонент. В качестве исходной информации предпочтение отдавалось открытым данным, прежде всего с OSM. Исследование проводилось на территории 40 субъектов Европейской части территории РФ, как единого целого общей площадью 1.8 млн. кв.км. Некоторые задачи, решаемые методом потенциалов:
Определение набора бальных оценок в каждой точке территории, дающего представление об уровне развития территории в общем, и в некоторой предметной области в частности. Например, торговли, промышленности, услуг и т.д.
Расчет рекомендаций для размещения нового объекта, в том числе составного объекта, включающего другие объекты.
Нахождение моделей стоимости или ценности территории для каждого кластера.
Сравнение территорий, т.е составление рейтингов территорий (о чем пойдет речь в данной статье).
Масштабы исследования
Упомянутые задачи решаются для уровня городов (несколько сотен кв. км с пространственной точностью от 25 метров) и уровня областей (несколько сотен тысяч кв.км с пространственной точностью от 250 метров). В статье описаны методы проведения анализа территории в новом масштабе – объединение городов, областей, округов в единое пространство.
Основные методы исследования:
Используется открытая пространственной информация, прежде всего OSM, и методы ее обработки.
Для учета степени влияния объектов разной природы на территорию используется метод потенциалов.
Для снижения размерности задачи и улучшения качества моделей используется метод главных компонент.
Для расчета линейных моделей используется <a href=«ru.wikipedia.org/wiki/Мет• Для анализа применяются методы кластеризации, позволяющие определить однородные области. Для каждого кластера составляется своя модель, на границах кластеров модели сшиваются.
Исследование проведено на уровне субъектов Российской Федерации и крупных городов, с последующим их объединением.
В первую очередь представляем алгоритм и результаты исследования однородных территорий субъектов Российской Федерации – Приволжский ФО, Центральный ФО, Южный ФО, Северо-Западный ФО и часть Уральского ФО, таким образом общая площадь исследования составила примерно 1.8 млн. кв км.
Описание технологии исследования:
Сбор исходной информации из открытых источников данных (наше предпочтение — OpenStreetMap) в разрезе каждого субъекта РФ. Исходная информация скачивается с максимальным для всех факторов радиусом влияния Rmax (к примеру, в нашем случае максимальный радиус влияния составил 50 км, т.е информацию будем скачивать с буфером в 50км).
Построение сетки проводится четко в границах субъекта РФ (шаг сетки для данного исследования – 1 километр), а процедура разбиения факторов влияния на фрагменты для дальнейшего расчета потенциалов проводится с учетом построенного буфера, для того чтобы учесть влияние факторов на границе субъекта.
Расчет значений потенциалов и заполнение результатов расчета в узлах сетки проводится в границах субъекта РФ.
Объединение субъектов РФ в «единый проект». Т.е на данном этапе мы объединяем все, построенные для каждого субъекта ранее, сетки в одну. Таким образом, мы получаем сетку, покрывающую площадь 1.8 млн. кв км. и содержащую 1.8 млн. узлов (точек анализа) и 88 факторов влияния (по нашему мнению, наиболее влияющие факторы OSM – точечные и протяженные объекты (магистрали, леса, реки, объекты инфраструктуры)).
Расчет интегральных показателей, с использованием метода главных компонент.
Поиск однородных областей.
Исследуемые территории объединяются в однородные области по факторам, описывающим какую-либо сторону развития территории, например, социальную сферу, торговлю, промышленность.
Ниже на рисунке приведены изображения однородных областей «единого проекта» в разрезе тем: промышленность, торговля, услуги.
Однородные территории европейской части РФ по фактору «промышленность»
Однородные территории европейской части РФ по фактору «промышленность» (фрагмент г. Москва)
Однородные территории европейской части РФ по фактору «торговля»
Однородные территории европейской части РФ по фактору «торговля» (фрагмент г. Москва)
Однородные территории европейской части РФ по фактору «услуги»
Однородные территории европейской части РФ по фактору «услуги» (фрагмент г. Москва)
На представленных изображениях достаточно очевидно преобладают центры субъектов РФ, но также можно отметить, что некоторые однородные области (области подсвеченные одним цветом) встречаются практически в каждом субъекте. Другими словами, это однородные (по значимости) территории в разных субъектах являются наиболее привлекательными, как в инвестиционном так и в других планах.
Следующим этапом исследования было составление рейтингов субъектов европейской части РФ, которые приведены ниже в таблицах.
Составленные рейтинги показывают лучший квадратный километр, лучшие 100 кв. км и лучшие 20 000 кв.км. Следует отметить, что это не определенный фрагмент территории размером в 1, 100 или 20 000 кв.км., а совокупность узлов сетки (точек анализа), построенной на субъект, которые имеют наилучшие интегральные характеристики, т.е эти узлы могут быть расположены хаотично по территории субъекта РФ.
Таблица 1. Рейтинг субъектов РФ (лучший 1 кв.км.)
Таблица 2. Рейтинг субъектов РФ (лучшие 100 кв.км.)
Таблица 3. Рейтинг субъектов РФ (лучшие 20 000 кв.км.)
Первые позиции рейтинга занимают — Москва и Московская область, Санкт-Пeтербург и Ленинградская область, Свердловская область, Челябинская область, Нижегородская область, Татарстан. Однако стоит обратить внимание, что рейтинг «плавающий» в зависимости от масштаба исследований (субъекты РФ меняются местами), т.е на набор наилучших узлов влияет, что мы рассматриваем -1 кв.км это или 100 кв.км., или 20 000 кв.км.
Решая подобную задачу для центров субъектов РФ (мы выбрали 40 крупнейших и крупных центров) задаем шаг построения сетки 100 метров и получаем следующие результаты.
Таблица 4. Рейтинг центров субъектов РФ (лучшая 0.01 кв. км. — лучшая точка территории)
Таблица 5. Рейтинг центров субъектов РФ (лучшие 10 кв.км.)
Таблица 6. Рейтинг центров субъектов РФ (лучшие 200 кв.км.)
Таким образом, как и в задаче на уровне субъектов РФ рейтинг получился зависимым от исследуемого масштаба. Это объясняется тем, что количество узлов сетки (точек анализа) с наилучшими интегральными показателями меняется в зависимости от выбранного масштаба.
В заключении стоит отметить, что любой рейтинг – вещь, располагающая к дискуссии, однако, нами проводилась исследовательская работа на открытых данных с применением новых методов анализа территории, позволяющих перенести существующие методы на более мелкий масштаб — уровня субъектов РФ, федеральных округов и далее.
Изменяемый масштаб и новые методы позволяют анализировать удаленные друг от друга объекты как единое целое, учитывая взаимное влияние территорий друг на друга.