Toolbox para sa mga Mananaliksik - Ikalawang Edisyon: Isang Koleksyon ng 15 Thematic Data Banks

Ang mga bangko ng data ay tumutulong na ibahagi ang mga resulta ng mga eksperimento at mga sukat at gumaganap ng isang mahalagang papel sa pagbuo ng kapaligirang pang-akademiko at sa proseso ng pagbuo ng mga espesyalista.

Pag-uusapan natin ang parehong mga dataset na nakuha gamit ang mamahaling kagamitan (ang mga pinagmumulan ng data na ito ay kadalasang malalaking internasyonal na organisasyon at mga programang pang-agham, kadalasang nauugnay sa mga natural na agham), at tungkol sa mga bangko ng data ng gobyerno.

Toolbox para sa mga Mananaliksik - Ikalawang Edisyon: Isang Koleksyon ng 15 Thematic Data Banks
Larawan Jan Antonin Kolar β€” Unsplash

Data.gov.ru ay isang proyekto ng gobyerno sa larangan ng open data, na kilala ng mga residente ng Habra. Ang Moscow analogue nito ay Data.mos.ru. Sa mga dayuhang opsyon ito ay nagkakahalaga ng pagpuna Data.gov - isang platform na may bukas na data mula sa gobyerno ng US (iisang katalogo may mga filter).

Sistema ng Impormasyon sa Unibersidad ay isang proyekto ng MSU na pinagsasama ang mga database sa mga istatistikal na impormasyon sa sitwasyong panlipunan at pang-ekonomiya sa bansa, pati na rin ang mga publikasyon mula sa pamahalaan at mga mapagkukunang siyentipiko. Ang data ay kinuha kapwa mula sa Rosstat at mula sa mga pag-aaral na isinagawa sa Moscow State University. Maaari mong gamitin ang mapagkukunan nang walang paunang pagpaparehistro, ngunit para sa ganap na pag-access kakailanganin mong magsumite ng aplikasyon.

Cartographic database All-Russian Geological Institute na pinangalanan. Karpinsky. Ang impormasyon tungkol sa mga likas na yaman ng bansa, na nakolekta sa panahon ng pagkakaroon ng institusyon, ay naka-plot sa mga digital na mapa. Binibigyang-daan ka ng interface ng site na ihambing ang OpenStreetMap o Y.Maps sa ilang karagdagang mga. mga layer na may impormasyon tungkol sa magnetic field, mineral, atbp.

GEOSS β€” isang portal para sa paghahanap ng data ng pagmamasid sa Earth mula sa mga satellite at drone ng iba't ibang uri. Ang resource archive ay kinokolekta ni 90 organisasyon Sa buong mundo. Upang makahanap ng impormasyon ng interes, piliin lamang ang nais na lugar sa mapa o magpasok ng mga keyword sa paghahanap.

MAST - isang archive na pinondohan ng NASA. Ang mga datos na ipinakita ay kinokolekta orbital teleskopyo β€” maaari kang mag-aral at mag-download ng pananaliksik gamit ang maghanap gamit ang mga filter.

Toolbox para sa mga Mananaliksik - Ikalawang Edisyon: Isang Koleksyon ng 15 Thematic Data Banks
Larawan Max Bender β€” Unsplash

OpenEI ay isang platform para sa paghahanap ng bukas na data sa paggamit ng enerhiya, lalo na sa renewable energy resources at mga bagong teknolohiya sa industriya. Ang site ay nakaayos ayon sa prinsipyo ng isang wiki - ang katumpakan ng data ay nasuri pamayanan.

Pang-eksperimentong Nuclear Reaction Data (EXFOR) β€” isang library na naglalaman ng data mula sa 22615 na mga eksperimento na may mga elementarya na particle. Kumpleto sa mga database ng CINDA (Computer Index of Nuclear Reaction Data) at IBANDL (Ion Beam Analysis Nuclear Data Library), isa ito sa pinakamalaking nuclear physics data banks. Na-curate ng Brookhaven National Laboratory sa US, ngunit naglalaman ng mga eksperimento mula sa buong mundo - kabilang ang Russia at China.

Mga Pambansang Sentro para sa Impormasyon sa Kapaligiran β€” archive ng data sa kapaligiran. Dito magkakaroon ka ng access sa dalawampung petabytes ng data ng karagatan, geopisiko, atmospera at baybayin. Sa partikular, mayroong impormasyon tungkol sa lalim ng karagatan, ang ibabaw ng Araw, mga talaan ng mga sedimentary na bato at mga imahe ng satellite. Upang mahanap ang kinakailangang dataset, maaari mong gamitin katalogo.

AD ay isang repository para sa archaeological data discovery na pinapatakbo ng University of York. May mga luma at bagong siyentipikong publikasyon, impormasyon tungkol sa mga paghuhukay at artifact. Mayroong tatlong kategorya para sa paghahanap: ArchSearch, Archives at Library. Ang una ay nag-iimbak ng data sa mga paghuhukay at artifact. Ang pangalawa ay naglalaman ng archive ng lahat ng na-download na materyales. Ang pangatlo ay naglalaman ng mga publikasyon sa journal, libro at pananaliksik. May mga opsyon sa paghahanap ayon sa bansa, panahon at uri ng bagay.

DRYAD β€” Tinutulungan ka ng serbisyong ito na maghanap ng impormasyon para sa siyentipikong pananaliksik gamit ang isang data bank na may 80 libong mga file. Ang pananaliksik at mga artikulo mula sa bangko ay maaaring gamitin sa ilalim ng lisensya CC0. Kasama sa mga paksang sakop ang iba't ibang larangan ng kaalaman, ngunit karamihan sa pananaliksik ay nauugnay sa medisina at computer science. Ayon sa panloob mga istatistika, noong 2018, ang mga gumagamit ng site ay pinaka-interesado sa mga kanta ng mga balyena, ang temperatura tolerance ng marine life, at neural na aktibidad sa temporal na lobe ng utak ng tao.

Toolbox para sa mga Mananaliksik - Ikalawang Edisyon: Isang Koleksyon ng 15 Thematic Data Banks
Nasa laboratoryo"Mga pangakong nanomaterial at optoelectronic na aparatoΒ» Unibersidad ng ITMO

GenBank β€” DNA library na ibinigay ng US National Center for Biotechnology Information (NCBI), gayundin ng mga data bank sa Europe at Japan. Available paghahanap sa pamamagitan ng mga identifier sa isang espesyal na search engine, gamit ang isang tool BLAST o sa pamamagitan ng programming.

PubChem ay isang database ng mga compound at bioassay na pinananatili ng US National Center for Biotechnology Information. Mayroong web interface na may advanced na paghahanap (halimbawa tungkol sa side effects ng tubig). Ang data ay ipinamamahagi sa ilalim ng mga karapatan ng pampublikong domain.

Protein Data Bank (RCSB PDB) ay isang bangko ng mga larawan ng mga protina at nucleic acid, na ang kasaysayan ay nagsimula noong 1971. Orihinal na binuo bilang isang panloob na proyekto sa Brookhaven National Laboratory, ito ay lumago upang maging ang pinakamalaking internasyonal na database ng uri nito. Karamihan sa mga akademikong journal na may kaugnayan sa biochemistry ay nag-oobliga sa mga may-akda na mag-post ng mga modelo ng protina na nakuha sa panahon ng pananaliksik sa kanilang website.

InterPro β€” isang database na pinagsasama-sama ang maraming dataset ng iba't ibang mga siyentipikong proyekto. Kasama ang Matalino ay isang programa para sa pagsusuri ng mga domain sa mga pagkakasunud-sunod ng protina, batay sa mga teknolohiya ng machine learning at isang dataset ng 1200 modelo. Sinusuportahan ng European Bioinformatics Institute.

Mga paglilibot sa larawan ng ITMO University laboratories:

Pinagmulan: www.habr.com

Magdagdag ng komento