Nagrada nazvana po Ilya Segalovich. Priča o informatici i lansiranju publikacija

Nagrada nazvana po Ilya Segalovich. Priča o informatici i lansiranju publikacija

Danas pokrećemo naučnu nagradu koja nosi ime Ilya Segalovich iseg. Biće dodeljena za dostignuća u oblasti računarstva. Studenti osnovnih i postdiplomskih studija mogu podnijeti vlastitu prijavu za nagradu ili imenovati naučne supervizore. Laureate će birati predstavnici akademske zajednice i Yandexa. Glavni kriteriji odabira: publikacije i prezentacije na konferencijama, kao i doprinos razvoju zajednice.

Prva dodjela nagrada održat će se u aprilu. U sklopu nagrade, mladi naučnici će dobiti 350 hiljada rubalja, a osim toga, moći će ići na međunarodnu konferenciju, raditi s mentorom i proći praksu u istraživačkom odjelu Yandexa. Naučni nadzornici će dobiti 700 hiljada rubalja.

Povodom otvaranja nagrade, odlučili smo da ovdje na Habréu razgovaramo o kriterijima uspjeha u svijetu informatike. Neki čitaoci Habra su već upoznati sa ovim kriterijumima, dok drugi mogu imati lažan utisak o njima. Danas ćemo premostiti ovaj jaz – dotaknut ćemo se svih glavnih tema, uključujući članke, konferencije, skupove podataka i transfer naučnih ideja u usluge.

Za naučnike iz oblasti računarstva, glavni kriterijum uspeha je objavljivanje njihovog naučnog rada na jednoj od vrhunskih međunarodnih konferencija. Ovo je prva „kontrolna tačka“ za prepoznavanje rada istraživača. Na primer, u oblasti mašinskog učenja uopšte, izdvajaju se Međunarodna konferencija o mašinskom učenju (ICML) i Konferencija o neuronskim sistemima za obradu informacija (NeurIPS, ranije NIPS). Postoje mnoge konferencije o specifičnim oblastima ML-a, kao što su kompjuterski vid, pronalaženje informacija, tehnologija govora, mašinsko prevođenje, itd.

Zašto objavljivati ​​svoje ideje

Ljudi koji su daleko od informatike mogu imati zabludu da je bolje čuvati najvrednije ideje u tajnosti i nastojati da profitiraju od njihove jedinstvenosti. Međutim, realna situacija na našem terenu je upravo suprotna. Autoritet naučnika se procenjuje po značaju njegovih radova, po tome koliko često njegove članke citiraju drugi naučnici (citatni indeks). Ovo je važna karakteristika njegove karijere. Istraživač napreduje na profesionalnoj ljestvici, postajući cijenjeniji u svojoj zajednici, samo ako dosljedno proizvodi snažan rad koji se objavljuje, postaje poznat i čini osnovu za rad drugih naučnika.

Mnogi vrhunski članci (možda većina) rezultat su saradnje između istraživača sa različitih univerziteta i kompanija širom svijeta. Važan i vrlo vrijedan trenutak u karijeri istraživača je kada on dobije priliku da sam pronalazi i procjeđuje ideje na osnovu svog iskustva – ali i nakon toga, kolege mu i dalje pružaju neprocjenjivu pomoć. Naučnici pomažu jedni drugima da razvijaju ideje, pišu članke u saradnji - i što je veći doprinos naučnika nauci, lakše mu je da pronađe istomišljenike.

Konačno, gustoća i dostupnost informacija sada je toliko velika da različiti istraživači istovremeno dolaze do vrlo sličnih (i zaista vrijednih) naučnih ideja. Ako vi ne objavite svoju ideju, neko drugi će je skoro sigurno objaviti umjesto vas. “Pobjednik” često nije onaj koji je inovaciju smislio nešto ranije, već onaj koji ju je objavio nešto ranije. Ili – onaj koji je uspio što potpunije, jasnije i uvjerljivije otkriti ideju.

Nagrada nazvana po Ilya Segalovich. Priča o informatici i lansiranju publikacija

Članci i skupovi podataka

Dakle, naučni članak je izgrađen oko glavne ideje koju istraživač predlaže. Ova ideja je njegov doprinos informatici. Članak počinje opisom ideje, formuliranim u nekoliko rečenica. Nakon toga slijedi uvod koji opisuje niz problema koji se rješavaju uz pomoć predložene inovacije. Opis i uvod su obično napisani jednostavnim jezikom koji je razumljiv širokoj publici. Nakon uvoda, potrebno je formalizirati probleme predstavljene matematičkim jezikom i uvesti strogu notaciju. Zatim, koristeći uvedene notacije, potrebno je kreirati jasnu i sveobuhvatnu izjavu o suštini predložene inovacije, te identificirati razlike u odnosu na prethodne, slične metode. Sve teorijske izjave moraju ili biti potkrijepljene referencama na prethodno prikupljene dokaze ili moraju biti dokazane nezavisno. Ovo se može uraditi uz neke pretpostavke. Na primjer, možete dati dokaz za slučaj kada postoji beskonačna količina podataka za obuku (očigledno nedostižna situacija) ili su potpuno neovisni jedan od drugog. Pred kraj članka, naučnik govori o eksperimentalnim rezultatima koje je uspio dobiti.

Nagrada nazvana po Ilya Segalovich. Priča o informatici i lansiranju publikacija

Da bi recenzenti koje su angažovali organizatori konferencije vjerojatnije da će odobriti rad, on mora imati jedan ili više atributa. Ključni faktor koji povećava šanse za odobrenje je naučna novina predložene ideje. Često se novost ocjenjuje u odnosu na već postojeće ideje – a posao ocjene ne obavlja recenzent, već sam autor članka. Idealno bi bilo da autor u članku detaljno ispriča o postojećim metodama i, ako je moguće, predstavi ih kao posebne slučajeve svoje metode. Dakle, naučnik pokazuje da prihvaćeni pristupi ne funkcionišu uvek, da ih je generalizovao i predložio širu, fleksibilniju i stoga delotvorniju teorijsku formulaciju. Ako je novost neosporna, u suprotnom recenzenti ne ocjenjuju članak ne tako izbirljivo - na primjer, mogu zažmiriti na loš engleski.

Da bi se pojačala novina, korisno je uključiti poređenje sa postojećim metodama na jednom ili više skupova podataka. Svaki od njih treba da bude otvoren i prihvaćen u akademskom okruženju. Na primjer, postoji ImageNet spremište slika i baze podataka takvih instituta kao što su Modificirani nacionalni institut za standarde i tehnologiju (MNIST) i CIFAR (Kanadski institut za napredna istraživanja). Poteškoća je u tome što se takav „akademski“ skup podataka često razlikuje po strukturi sadržaja od stvarnih podataka kojima se industrija bavi. Različiti podaci znače različite rezultate predložene metode. Naučnici koji djelimično rade za industriju pokušavaju to uzeti u obzir i ponekad ubacuju klauzule poput „na našim podacima rezultat je takav i takav, ali na javnom skupu podataka – takav i takav“.

Dešava se da je predložena metoda potpuno „skrojena“ za otvorenu bazu podataka i ne radi na stvarnim podacima. Možete se boriti protiv ovog uobičajenog problema otvaranjem novih, reprezentativnijih skupova podataka, ali često govorimo o privatnom sadržaju koji kompanije jednostavno nemaju pravo otvarati. U nekim slučajevima provode (ponekad složenu i mukotrpnu) anonimizaciju podataka - uklanjaju sve fragmente koji upućuju na određenu osobu. Na primjer, lica i brojevi na fotografijama se brišu ili čine nečitkim. Osim toga, kako bi skup podataka bio ne samo dostupan svima, već i postao standard među naučnicima na kojem je zgodno upoređivati ​​ideje, potrebno ga je ne samo objaviti, već i napisati poseban citirani članak o to i njegove prednosti.

Još je gore kada nema otvorenih skupova podataka u temi koja se proučava. Tada recenzent može samo na vjeru prihvatiti rezultate koje je autor predstavio. Teoretski, autor bi ih čak mogao precijeniti i ostati neotkriven, ali u akademskom okruženju to je malo vjerovatno, jer se kosi sa željom velike većine naučnika da razvijaju nauku.

U brojnim oblastima ML-a, uključujući kompjuterski vid, takođe je uobičajeno da se uz članke dodaju veze na kod (obično na GitHub). Sami članci ili sadrže vrlo malo koda ili su pseudokod. I tu, opet, poteškoće nastaju ako članak piše istraživač iz kompanije, a ne sa univerziteta. Prema zadanim postavkama, kod napisan u korporaciji ili startupu je označen kao NDA. Istraživači i njihove kolege moraju naporno raditi kako bi odvojili kod vezan za ideju koja se opisuje od internih i svakako zatvorenih spremišta.

Šansa za objavljivanje zavisi i od relevantnosti odabrane teme. Relevantnost je u velikoj mjeri diktirana proizvodima i uslugama: ako je korporacija ili startup zainteresirana za izgradnju nove usluge ili poboljšanje postojeće na temelju ideje iz članka, to je plus.

Nagrada nazvana po Ilya Segalovich. Priča o informatici i lansiranju publikacija

Kao što je već spomenuto, radovi iz informatike rijetko se pišu sami. Ali po pravilu, jedan od autora troši mnogo više vremena i truda od ostalih. Njegov doprinos naučnoj novini je najveći. Na spisku autora takva osoba je prva naznačena - a ubuduće, kada se poziva na članak, mogu ga samo spomenuti (na primjer, "Ivanov i ostali" - "Ivanov i drugi" u prijevodu s latinskog). Međutim, i doprinosi drugih su izuzetno vrijedni - inače je nemoguće biti na spisku autora.

Proces revizije

Radovi obično prestaju da se primaju nekoliko mjeseci prije konferencije. Nakon podnošenja članka, recenzenti imaju 3-5 sedmica da ga pročitaju, procijene i komentiraju. To se dešava po jednostrukom slijepom sistemu, kada autori ne vide imena recenzenata, ili dvostrukom slijepom, kada sami recenzenti ne vide imena autora. Druga opcija se smatra nepristrasnijom: nekoliko naučnih radova pokazalo je da popularnost autora utiče na odluku recenzenta. Na primjer, može smatrati da je naučnik s velikim brojem već objavljenih članaka a priori dostojan više ocjene.

Štaviše, čak iu slučaju dvostruke slijepe osobe, recenzent će vjerovatno pogoditi autora ako rade u istoj oblasti. Osim toga, u vrijeme recenzije, članak bi možda već bio objavljen u bazi podataka arXiv, najvećem repozitoriju naučnih radova. Organizatori konferencije to ne zabranjuju, ali preporučuju korištenje drugog naslova i drugačijeg sažetka u publikacijama za arXiv. Ali ako je članak tamo objavljen, i dalje ga neće biti teško pronaći.

Uvijek postoji nekoliko recenzenata koji ocjenjuju članak. Jednom od njih je dodijeljena uloga meta-recenzenta, koji samo treba da pregleda presude svojih kolega i donese konačnu odluku. Ako se recenzenti ne slažu oko članka, meta-recenzent ga također može pročitati radi potpunosti.

Ponekad, nakon pregleda ocjene i komentara, autor ima priliku da uđe u diskusiju sa recenzentom; postoji čak i šansa da ga se ubijedi da promijeni svoju odluku (međutim, takav sistem ne funkcionira za sve konferencije, a još manje je moguće ozbiljno utjecati na presudu). U raspravi se ne možete pozivati ​​na druge naučne radove, osim na one koji su već navedeni u članku. Možete samo da „pomognete“ recenzentu da bolje razume sadržaj članka.

Nagrada nazvana po Ilya Segalovich. Priča o informatici i lansiranju publikacija

Konferencije i časopisi

Računarski članci se češće šalju na konferencije nego u naučne časopise. To je zato što publikacije u časopisima imaju zahtjeve koje je teže ispuniti, a proces recenzije može trajati mjesecima ili čak godinama. Računarstvo je oblast koja se veoma brzo razvija, tako da autori obično nisu voljni da čekaju toliko dugo na objavljivanje. Međutim, članak koji je već prihvaćen za konferenciju može se zatim dopuniti (na primjer, predstavljanjem detaljnijih rezultata) i objaviti u časopisu gdje ograničenja prostora nisu tako stroga.

Događaji na konferenciji

Format za prisustvo autora odobrenih članaka na konferenciji određuju recenzenti. Ako je članku dato zeleno svjetlo, tada vam se najčešće dodjeljuje štand za poster. Poster je statični slajd sa sažetkom članka i ilustracijama. Neke konferencijske sale su ispunjene dugim redovima štandova za poster. Autor provodi značajan dio svog vremena u blizini svog postera, komunicirajući sa naučnicima koji su zainteresirani za članak.

Nagrada nazvana po Ilya Segalovich. Priča o informatici i lansiranju publikacija

Nagrada nazvana po Ilya Segalovich. Priča o informatici i lansiranju publikacija

Nešto prestižnija opcija za učešće je munjevit razgovor. Ako recenzenti smatraju da je članak vrijedan kratkog izvještaja, autoru je dato oko tri minuta da govori širokoj publici. S jedne strane, munjevit razgovor je dobra prilika da o svojoj ideji ispričate ne samo onima koji su se samoinicijativno zainteresovali za poster. S druge strane, proaktivni posjetioci postera su spremniji i više uronjeni u vašu specifičnu temu od prosječnog slušatelja u dvorani. Stoga, u brzom izvještaju, još uvijek morate imati vremena da informišete ljude.

Nagrada nazvana po Ilya Segalovich. Priča o informatici i lansiranju publikacija

Obično, na kraju svog munjevitog govora, autori imenuju broj postera kako bi ga slušaoci mogli pronaći i bolje razumjeti članak.

Nagrada nazvana po Ilya Segalovich. Priča o informatici i lansiranju publikacija

Posljednja, najprestižnija opcija je poster plus cjelovita prezentacija ideje, kada više nema potrebe žuriti s pričanjem.

Nagrada nazvana po Ilya Segalovich. Priča o informatici i lansiranju publikacija

Ali naravno, naučnici – uključujući i autore odobrenih članaka – dolaze na sljedeću konferenciju ne samo da bi se pokazali. Prvo, oni imaju tendenciju da pronađu postere koji se odnose na njihovu oblast iz očiglednih razloga. I drugo, važno im je da prošire listu kontakata u svrhu zajedničkog akademskog rada u budućnosti. Ovo nije lov - ili, barem, njegova prva faza, nakon koje u najmanju ruku slijedi obostrano korisna razmjena ideja, razvoja i zajednički rad na jednom ili više članaka.

Istovremeno, produktivno umrežavanje na vrhunskoj konferenciji je teško zbog potpunog nedostatka slobodnog vremena. Ako je nakon cijelog dana provedenog na prezentacijama i u raspravama na posterima, naučnik zadržao snagu i već je savladao jet lag, onda odlazi na jednu od mnogih zabava. Domaćini su od strane korporacija - kao rezultat toga, zabave često imaju više lovački karakter. Istovremeno, mnogi gosti ih koriste uopće ne za pronalaženje novog posla, već, opet, za umrežavanje. U večernjim satima više nema izvještaja i postera - lakše je "uhvatiti" stručnjaka za kojeg ste zainteresovani.

Nagrada nazvana po Ilya Segalovich. Priča o informatici i lansiranju publikacija

Od ideje do proizvodnje

Računarska nauka je jedna od rijetkih industrija u kojoj su interesi korporacija i startupa snažno povezani sa akademskim okruženjem. NIPS, ICML i druge slične konferencije privlače mnogo ljudi iz industrije, ne samo sa univerziteta. Ovo je tipično za oblast računarstva, ali obrnuto za većinu drugih nauka.

S druge strane, sve ideje predstavljene u člancima ne idu odmah ka stvaranju ili poboljšanju usluga. Čak i unutar jedne kompanije, istraživač može kolegama iz službe predložiti ideju koja je revolucionarna po naučnim standardima i dobiti odbijenicu da je implementira iz više razloga. Jedan od njih je već spomenut ovdje - to je razlika između "akademskog" skupa podataka na kojem je članak napisan i stvarnog skupa podataka. Osim toga, implementacija ideje može biti odgođena, zahtijevati veliku količinu resursa ili poboljšati samo jedan pokazatelj po cijenu pogoršanja drugih metrika.

Nagrada nazvana po Ilya Segalovich. Priča o informatici i lansiranju publikacija

Situaciju spašava činjenica da su mnogi programeri i sami pomalo istraživači. Oni prisustvuju konferencijama, govore istim jezikom sa akademicima, predlažu ideje, ponekad učestvuju u kreiranju članaka (na primjer, pisanje koda), ili čak i sami djeluju kao autori. Ako je programer uronjen u akademski proces, prati šta se dešava u istraživačkom odjelu, jednom riječju - ako demonstrira kontra-pokret prema naučnicima, onda se skraćuje ciklus pretvaranja naučnih ideja u nove servisne mogućnosti.

Svim mladim istraživačima želimo puno sreće i uspeha u radu. Ako vam ovaj post nije rekao ništa novo, onda ste možda već objavili na vrhunskoj konferenciji. Registrujte se za premium sebe i imenovati naučne supervizore.

izvor: www.habr.com

Dodajte komentar