Toolbox для даследчыкаў - выпуск другой: падборка з 15 тэматычных банкаў дадзеных

Банкі даных дапамагаюць дзяліцца вынікамі эксперыментаў і вымярэнняў, адыгрываюць важную ролю ў фарміраванні акадэмічнага асяроддзя і ў працэсе развіцця спецыялістаў.

Раскажам як аб датасетах, атрыманых з дапамогай дарагога абсталявання (крыніцамі гэтых дадзеных нярэдка з'яўляюцца буйныя міжнародныя арганізацыі і навуковыя праграмы, часцей за ўсё звязаныя з прыродазнаўчымі навукамі), так і аб дзяржаўных банках дадзеных.

Toolbox для даследчыкаў - выпуск другой: падборка з 15 тэматычных банкаў дадзеных
Фота Jan Antonin Kolar - Unsplash

Data.gov.ru - добра знаёмы хабражыхарам дзяржаўны праект у сферы адкрытых дадзеных. Яго маскоўскі аналаг - Data.mos.ru. З замежных варыянтаў варта адзначыць Data.gov - пляцоўку з адкрытымі дадзенымі ад урада ЗША (адзіны каталог з фільтрамі).

Універсітэцкая інфармацыйная сістэма - Праект МДУ, які аб'ядноўвае базы са статыстычнай інфармацыяй аб сацыяльным і эканамічным становішчы ў краіне, а таксама публікацыі з дзяржаўных і навуковых крыніц. Дадзеныя бяруцца як з Расстата, так і з даследаванняў, праведзеных на базе МДУ. Рэсурсам можна карыстацца і без папярэдняй рэгістрацыі, але для паўнавартаснага доступу спатрэбіцца падаць заяўку.

Картаграфічная база Усерасійскага геалагічнага інстытута ім. Карпінскага. Інфармацыя аб прыродных рэсурсах краіны, сабраная за час існавання ўстановы, была нанесена на лічбавыя карты. Інтэрфейс пляцоўкі дазваляе супаставіць OpenStreetMap ці Я.Карты з побач доп. пластоў з інфармацыяй аб магнітным полі, карысных выкапняў і інш.

GEOSS - партал для пошуку дадзеных назірання Зямлі са спадарожнікаў і Дронов розных тыпаў. Архіў рэсурсу збіраюць сіламі 90 арганізацый па ўсім свеце. Каб знайсці звесткі, якія цікавяць, дастаткова вылучыць патрэбную вобласць на карце або ўбіць у пошук ключавыя словы.

МАСТ - архіў, які фінансуецца NASA. Прадстаўленыя дадзеныя сабраны арбітальнымі тэлескопамі - вывучаць і спампоўваць даследаванні можна з дапамогай пошуку з фільтрамі.

Toolbox для даследчыкаў - выпуск другой: падборка з 15 тэматычных банкаў дадзеных
Фота Макс Бэндэр - Unsplash

OpenEI — платформа для пошуку адкрытых даных аб выкарыстанні энергіі, у прыватнасці аб аднаўляльных энергарэсурсах і новых тэхналогіях у галіне. Сайт арганізаваны па прынцыпе вікі - дакладнасць дадзеных правяраецца супольнасцю.

Experimental Nuclear Reaction Data (EXFOR) - бібліятэка, якая змяшчае дадзеныя 22615 эксперыментаў з элементарнымі часціцамі. У камплекце з базамі дадзеных CINDA (Computer Index of Nuclear Reaction Data) і IBANDL (Ion Beam Analysis Nuclear Data Library) з'яўляецца адным з найбуйных банкаў дадзеных па ядзернай фізіцы. Курыруецца Брукхейвенскай нацыянальнай лабараторыяй у ЗША, але змяшчае эксперыменты з усяго свету — уключаючы Расію і Кітай.

Нацыянальныя цэнтры экалагічнай інфармацыі - архіў экалагічных дадзеных. Тут вы атрымаеце доступ да дваццаці петабайт акіянічных і геафізічных дадзеных, а таксама звесткам аб атмасферы і прыбярэжных зонах. У прыватнасці, тут знойдзецца інфармацыя аб глыбіні акіяна, паверхні Сонца, запісы аб ападкавых пародах і спадарожнікавыя здымкі. Для пошуку патрэбнага датасета можна скарыстацца каталогам.

ADS - Рэпазітар для пошуку археалагічных дадзеных пад кіраваннем Йоркскага універсітэта. Тут ёсць старыя і новыя навуковыя публікацыі, звесткі аб раскопках і артэфактах. Для пошуку прапануюць тры катэгорыі: ArchSearch, Archives і Library. У першай захоўваюцца дадзеныя аб раскопках і артэфактах. У другой - архіў усіх загружаных матэрыялаў. У трэцяй - публікацыі з часопісаў, кнігі і даследаванні. Ёсць опцыі пошуку па краінах, эпохам і тыпам аб'ектаў.

ДРЫЯДА - Гэты сэрвіс дапамагае шукаць інфармацыю для навуковых даследаванняў па банку дадзеных з 80 тысяч файлаў. Даследаванні і артыкулы з банка можна выкарыстоўваць па ліцэнзіі CC0. Тэматыка матэрыялаў уключае розныя галіны ведаў, аднак большасць даследаванняў звязаны з медыцынай і камп'ютарнымі навукамі. Згодна з унутранай статыстыцы, у 2018 годзе карыстальнікі сайта найбольш цікавіліся песнямі кітоў, тэмпературнай талерантнасцю марскіх насельнікаў, і нейронавай актыўнасцю ў скроневай долі чалавечага мозгу.

Toolbox для даследчыкаў - выпуск другой: падборка з 15 тэматычных банкаў дадзеных
У лабараторыі "Перспектыўныя нанаматэрыялы і оптаэлектронныя прылады» Універсітэта ІЦМА

GenBank - ДНК-бібліятэка, якую падае Нацыянальны цэнтр біятэхналагічнай інфармацыі ЗША (NCBI), а таксама банкі дадзеных Еўропы і Японіі. Даступны пошук па ідэнтыфікатарах у спецыяльным пошукавым рухавічку, з дапамогай інструмента BLAST або праграмным шляхам.

PubChem — база даных злучэнняў і біяпроб, якую змяшчае нацыянальны цэнтр біятэхналагічнай інфармацыі ЗША. Ёсць вэб-інтэрфейс з пашыраным пошукам (прыклад пра пабочныя эфекты вады). Дадзеныя распаўсюджваюцца на правах грамадскага набытку.

Protein Data Bank (RCSB PDB) - Банк малюнкаў бялкоў і нуклеінавых кіслот, гісторыя якога адлічваецца яшчэ з 1971 года. Першапачаткова распрацоўваўся, як унутраны праект Брукхейвенскай нацыянальнай лабараторыі, але ў далейшым ператварыўся ў найбуйнейшую міжнародную базу даных свайго тыпу. Большасць акадэмічных часопісаў, звязаных з біяхіміяй, абавязваюць аўтараў размяшчаць на сайце атрыманыя падчас даследаванняў бялковыя мадэлі.

ІнтэрПро - база даных, якая аб'ядноўвае мноства датасетаў розных навуковых праектаў. Уключае ў сябе SMART - праграму для аналізу даменаў у бялковых паслядоўнасцях, заснаваную на тэхналогіях машыннага навучання і датасет з 1200 мадэляў. Падтрымліваецца Еўрапейскім інстытутам біяінфарматыкі.

Фотаэкскурсіі па лабараторыях Універсітэта ІЦМА:

Крыніца: habr.com

Дадаць каментар