Банки данных помогают делиться результатами экспериментов и измерений, играют важную роль в формировании академической среды и в процессе развития специалистов.
Расскажем как о датасетах, полученных с помощью дорогостоящего оборудования (источниками этих данных нередко являются крупные международные организации и научные программы, чаще всего связанные с естественными науками), так и о государственных банках данных.
Фото — Unsplash
— хорошо знакомый хабражителям государственный проект в сфере открытых данных. Его московский аналог — . Из зарубежных вариантов стоит отметить — площадку с открытыми данными от правительства США ( с фильтрами).
— проект МГУ, объединяющий базы со статистической информацией о социальном и экономическом положении в стране, а также публикации из государственных и научных источников. Данные берутся как из Росстата, так и из исследований, проведенных на базе МГУ. Ресурсом можно воспользоваться и без предварительной регистрации, но для полноценного доступа потребуется подать заявку.
Всероссийского геологического института им. Карпинского. Информация о природных ресурсах страны, собранная за время существования учреждения, была нанесена на цифровые карты. Интерфейс площадки позволяет сопоставить OpenStreetMap или Я.Карты с рядом доп. слоев с информацией о магнитном поле, полезных ископаемых и др.
— портал для поиска данных наблюдения Земли со спутников и дронов различных типов. Архив ресурса собирают силами по всему миру. Чтобы найти интересующие сведения, достаточно выделить нужную область на карте или вбить в поиск ключевые слова.
— архив, который финансируется NASA. Представленные данные собраны — изучать и скачивать исследования можно с помощью .

Фото — Unsplash
— платформа для поиска открытых данных об использовании энергии, в частности о возобновляемых энергоресурсах и новых технологиях в отрасли. Сайт организован по принципу вики — достоверность данных проверяется .
— библиотека, содержащая данные 22615 экспериментов с элементарными частицами. В комплекте с базами данных CINDA (Computer Index of Nuclear Reaction Data) и IBANDL (Ion Beam Analysis Nuclear Data Library) является одним из крупнейших банков данных по ядерной физике. Курируется Брукхейвенской национальной лабораторией в США, но содержит эксперименты со всего мира — включая .
— архив экологических данных. Здесь вы получите доступ к двадцати петабайтам океанических и геофизических данных, а также сведениям об атмосфере и прибрежных зонах. В частности, тут найдется информация о глубине океана, поверхности Солнца, записи об осадочных породах и спутниковые снимки. Для поиска нужного датасета можно воспользоваться .
— репозиторий для поиска археологических данных под управлением Йоркского университета. Здесь есть старые и новые научные публикации, сведения о раскопках и артефактах. Для поиска предлагают три категории: ArchSearch, Archives и Library. В первой хранятся данные о раскопках и артефактах. Во второй — архив всех загруженных материалов. В третьей — публикации из журналов, книги и исследования. Есть опции поиска по странам, эпохам и типам объектов.
— этот сервис помогает искать информацию для научных исследований по банку данных из 80 тысяч файлов. Исследования и статьи из банка можно использовать по лицензии . Тематика материалов включает разные области знаний, однако большинство исследований связаны с медициной и компьютерными науками. Согласно внутренней , в 2018 году пользователи сайта наиболее интересовались песнями китов, температурной толерантностью морских обитателей, и нейронной активностью в височной доле человеческого мозга.

В лаборатории «» Университета ИТМО
— ДНК-библиотека, которую предоставляет Национальный центр биотехнологической информации США (NCBI), а также банки данных Европы и Японии. Доступен в специальном поисковом движке, с помощью инструмента или .
— база данных соединений и биопроб, которую содержит национальный центр биотехнологической информации США. Есть веб-интерфейс с расширенным поиском (пример про ). Данные распространяются на правах общественного достояния.
— банк изображений белков и нуклеиновых кислот, история которого отсчитывается еще с 1971 года. Изначально разрабатывался, как внутренний проект Брукхейвенской национальной лаборатории, но в последствии превратился в крупнейшую международную базу данных своего типа. Большинство академических журналов, связанных с биохимией, обязуют авторов размещать на сайте полученные в ходе исследований белковые модели.
— база данных, объединяющая множество датасетов различных научных проектов. Включает в себя — программу для анализа доменов в белковых последовательностях, основанную на технологиях машинного обучения и датасете из 1200 моделей. Поддерживается Европейским институтом биоинформатики.
Фотоэкскурсии по лабораториям Университета ИТМО:
Источник: habr.com
