Toolbox для дослідників - випуск другий: добірка з 15 тематичних банків даних

Банки даних допомагають ділитися результатами експериментів та вимірювань, відіграють важливу роль у формуванні академічного середовища та у процесі розвитку фахівців.

Розповімо як про датасети, отримані за допомогою дорогого обладнання (джерелами цих даних нерідко є великі міжнародні організації та наукові програми, найчастіше пов'язані з природничими науками), так і про державні банки даних.

Toolbox для дослідників - випуск другий: добірка з 15 тематичних банків даних
Фото Ян Антонін Колар - Unsplash

Data.gov.ru - добре знайомий хабражителям державний проект у сфері відкритих даних. Його московський аналог - Data.mos.ru. Із зарубіжних варіантів варто відзначити Data.gov - Майданчик з відкритими даними від уряду США (єдиний каталог із фільтрами).

Університетська інформаційна система — проект МДУ, який поєднує бази зі статистичною інформацією про соціальне та економічне становище в країні, а також публікації з державних та наукових джерел. Дані беруться як із Росстату, так і з досліджень, проведених на базі МДУ. Ресурс можна скористатися і без попередньої реєстрації, але для повноцінного доступу потрібно подати заявку.

Картографічна база Всеросійського геологічного інституту ім. Карпінського. Інформація про природні ресурси країни, зібрана за час існування установи, була нанесена на цифрові картки. Інтерфейс майданчика дозволяє зіставити OpenStreetMap або Я.Карти з рядом дод. шарів з інформацією про магнітне поле, корисні копалини та ін.

ГЕОСС - портал для пошуку даних спостереження Землі з супутників і дронів різних типів. Архів ресурсу збирають силами 90 організацій по всьому світу. Щоб знайти інформацію, що цікавить, достатньо виділити потрібну область на карті або вбити в пошук ключові слова.

МАСТ - Архив, який фінансується NASA. Подані дані зібрані орбітальними телескопами — вивчати та завантажувати дослідження можна за допомогою пошуку з фільтрами.

Toolbox для дослідників - випуск другий: добірка з 15 тематичних банків даних
Фото Макс Бендер - Unsplash

OpenEI — платформа для пошуку відкритих даних про використання енергії, зокрема про відновлювані енергоресурси та нові технології в галузі. Сайт організований за принципом вікі - достовірність даних перевіряється спільнотою.

Experimental Nuclear Reaction Data (EXFOR) - Бібліотека, що містить дані 22615 експериментів з елементарними частинками. У комплекті з базами даних CINDA (Computer Index of Nuclear Reaction Data) та IBANDL (Ion Beam Analysis Nuclear Data Library) є одним із найбільших банків даних з ядерної фізики. Курується Брукхейвенською національною лабораторією в США, але містить експерименти з усього світу - включаючи Росію та Китай.

Національні центри екологічної інформації - Архів екологічних даних. Тут ви отримаєте доступ до двадцяти петабайтів океанічних та геофізичних даних, а також відомостей про атмосферу та прибережні зони. Зокрема, тут знайдеться інформація про глибину океану, поверхню Сонця, записи про осадові породи та супутникові знімки. Для пошуку потрібного датасету можна скористатися каталогом.

ADS - Репозиторій для пошуку археологічних даних під керуванням Йоркського університету. Тут є старі та нові наукові публікації, відомості про розкопки та артефакти. Для пошуку пропонують три категорії: ArchSearch, Archives та Library. У першій зберігаються дані про розкопки та артефакти. У другій – архів усіх завантажених матеріалів. У третій - публікації з журналів, книги та дослідження. Є опції пошуку за країнами, епохами та типами об'єктів.

ДРІЯДА — цей сервіс допомагає шукати інформацію для наукових досліджень банку даних з 80 тисяч файлів. Дослідження та статті з банку можна використовувати за ліцензією CC0. Тематика матеріалів включає різні галузі знань, проте більшість досліджень пов'язані з медициною та комп'ютерними науками. Відповідно до внутрішньої статистикою, у 2018 році користувачі сайту найбільш цікавилися піснями китів, температурною толерантністю морських мешканців, та нейронною активністю у скроневій частині людського мозку.

Toolbox для дослідників - випуск другий: добірка з 15 тематичних банків даних
В лабораторії "Перспективні наноматеріали та оптоелектронні пристрої» Університету ІТМО

GenBank - ДНК-бібліотека, яку надає Національний центр біотехнологічної інформації США (NCBI), а також банки даних Європи та Японії. Доступний пошук за ідентифікаторами у спеціальному пошуковому двигуні, за допомогою інструмента BLAST або програмним шляхом.

PubChem - база даних сполук та біопроб, яку містить національний центр біотехнологічної інформації США. Є веб-інтерфейс з розширеним пошуком (приклад побічні ефекти води). Дані розповсюджуються на правах суспільного надбання.

Protein Data Bank (RCSB PDB) — банк зображень білків та нуклеїнових кислот, історія якого відраховується ще з 1971 року. Спочатку розроблявся як внутрішній проект Брукхейвенської національної лабораторії, але згодом перетворився на найбільшу міжнародну базу даних свого типу. Більшість академічних журналів, пов'язаних з біохімією, зобов'язують авторів розміщувати на сайті отримані під час досліджень білкові моделі.

ІнтерПро - база даних, що поєднує безліч датасетів різних наукових проектів. Включає в себе SMART — програму для аналізу доменів у білкових послідовностях, засновану на технологіях машинного навчання та датасеті із 1200 моделей. Підтримується Європейським інститутом біоінформатики.

Фотоекскурсії лабораторіями Університету ІТМО:

Джерело: habr.com

Додати коментар або відгук