Nagrada nazvana po Ilyi Segalovichu. Priča o informatici i lansiranju publikacija

Nagrada nazvana po Ilyi Segalovichu. Priča o informatici i lansiranju publikacija

Danas pokrećemo znanstvenu nagradu nazvanu po Ilyi Segalovichu iseg. Dodijelit će se za postignuća u području informatike. Studenti dodiplomskog i poslijediplomskog studija mogu sami podnijeti zahtjev za dodjelu nagrade ili imenovati znanstvene voditelje. Laureate će izabrati predstavnici akademske zajednice i Yandexa. Glavni kriteriji odabira: publikacije i izlaganja na konferencijama, kao i doprinos razvoju zajednice.

Prva dodjela nagrada održat će se u travnju. U sklopu nagrade mladi će znanstvenici dobiti 350 tisuća rubalja, a osim toga moći će ići na međunarodnu konferenciju, raditi s mentorom i stažirati u istraživačkom odjelu Yandexa. Znanstveni nadzornici dobit će 700 tisuća rubalja.

Povodom pokretanja nagrade, odlučili smo ovdje na Habréu progovoriti o kriterijima uspjeha u svijetu informatike. Neki čitatelji Habra već su upoznati s ovim kriterijima, dok bi drugi mogli imati pogrešan dojam o njima. Danas ćemo premostiti ovaj jaz - dotaknut ćemo se svih glavnih tema, uključujući članke, konferencije, skupove podataka i prijenos znanstvenih ideja u usluge.

Za znanstvenike iz područja računalnih znanosti glavni kriterij uspjeha je objava znanstvenog rada na nekoj od vrhunskih međunarodnih konferencija. To je prva “kontrolna točka” za prepoznavanje rada istraživača. Na primjer, u području strojnog učenja općenito, izdvajaju se Međunarodna konferencija o strojnom učenju (ICML) i Konferencija o sustavima obrade neuronskih informacija (NeurIPS, bivši NIPS). Postoje mnoge konferencije o specifičnim područjima strojnog pisma, kao što su računalni vid, pronalaženje informacija, govorna tehnologija, strojno prevođenje itd.

Zašto objavljivati ​​svoje ideje

Ljudi koji su daleko od informatike možda imaju pogrešno mišljenje da je bolje držati najvrjednije ideje u tajnosti i nastojati profitirati od njihove jedinstvenosti. Međutim, stvarno stanje na našem terenu je upravo suprotno. Autoritet znanstvenika procjenjuje se prema značaju njegovih radova, prema tome koliko često njegove članke citiraju drugi znanstvenici (indeks citiranosti). To je važna karakteristika njegove karijere. Istraživač napreduje na profesionalnoj ljestvici, postajući cijenjeniji u svojoj zajednici, samo ako dosljedno proizvodi snažan rad koji se objavljuje, postaje slavan i čini osnovu za rad drugih znanstvenika.

Mnogi vrhunski članci (možda većina) rezultat su suradnje između istraživača na različitim sveučilištima i kompanijama diljem svijeta. Važan i vrlo vrijedan trenutak u karijeri istraživača je kada dobije priliku da sam pronalazi i raščlanjuje ideje na temelju svog iskustva – no i nakon toga kolege mu pružaju neprocjenjivu pomoć. Znanstvenici jedni drugima pomažu razvijati ideje, pišu članke u suradnji - a što je veći doprinos znanstvenika znanosti, to mu je lakše pronaći istomišljenike.

Konačno, gustoća i dostupnost informacija sada je tolika da različiti istraživači istodobno dolaze s vrlo sličnim (i doista vrijednim) znanstvenim idejama. Ako vi ne objavite svoju ideju, netko drugi će je gotovo sigurno objaviti umjesto vas. “Pobjednik” često nije onaj tko je nešto ranije smislio inovaciju, nego onaj koji ju je malo prije objavio. Ili – onaj koji je uspio što potpunije, jasnije i uvjerljivije razotkriti ideju.

Nagrada nazvana po Ilyi Segalovichu. Priča o informatici i lansiranju publikacija

Članci i skupovi podataka

Dakle, znanstveni članak je izgrađen oko glavne ideje koju predlaže istraživač. Ova ideja njegov je doprinos informatici. Članak počinje opisom ideje formuliranom u nekoliko rečenica. Nakon toga slijedi uvod koji opisuje raspon problema koji se rješavaju uz pomoć predložene inovacije. Opis i uvod obično su napisani jednostavnim jezikom razumljivim širokoj publici. Nakon uvoda potrebno je formalizirati probleme prikazane matematičkim jezikom i uvesti strogu notaciju. Zatim, koristeći uvedene oznake, trebate stvoriti jasnu i opsežnu izjavu o biti predložene inovacije, te identificirati razlike u odnosu na prethodne, slične metode. Sve teorijske izjave moraju biti potkrijepljene referencama na prethodno prikupljene dokaze ili dokazane neovisno. To se može učiniti uz neke pretpostavke. Na primjer, možete dati dokaz za slučaj kada postoji beskonačna količina podataka za obuku (očigledno nedostižna situacija) ili su potpuno neovisni jedni o drugima. Pred kraj članka, znanstvenik govori o eksperimentalnim rezultatima koje je uspio dobiti.

Nagrada nazvana po Ilyi Segalovichu. Priča o informatici i lansiranju publikacija

Kako bi recenzenti koje su angažirali organizatori konferencije vjerojatnije odobrili rad, on mora imati jedan ili više atributa. Ključni čimbenik koji povećava izglede za odobrenje je znanstvena novost predložene ideje. Često se novost procjenjuje u odnosu na već postojeće ideje – a posao njezine ocjene ne obavlja recenzent, već sam autor članka. Idealno bi bilo da autor u članku detaljno govori o postojećim metodama i, ako je moguće, predstavi ih kao posebne slučajeve svoje metode. Time znanstvenik pokazuje da prihvaćeni pristupi ne funkcioniraju uvijek, da ih je generalizirao i predložio širu, fleksibilniju i stoga učinkovitiju teorijsku formulaciju. Ako je novost neporeciva, tada recenzenti ne ocjenjuju članak tako izbirljivo - na primjer, mogu zažmiriti na loš engleski.

Kako bi se pojačala novost, korisno je uključiti usporedbu s postojećim metodama na jednom ili više skupova podataka. Svaki od njih treba biti otvoren i prihvaćen u akademskoj sredini. Na primjer, postoji ImageNet repozitorij slika i baze podataka takvih instituta kao što su Modificirani nacionalni institut za standarde i tehnologiju (MNIST) i CIFAR (Kanadski institut za napredna istraživanja). Poteškoća je u tome što se takav "akademski" skup podataka često razlikuje u strukturi sadržaja od stvarnih podataka s kojima se industrija bavi. Različiti podaci znače različite rezultate predložene metode. Znanstvenici koji djelomično rade za industriju pokušavaju to uzeti u obzir i ponekad ubacuju odricanje od odgovornosti poput "na našim podacima rezultat je takav i takav, ali na javnom skupu podataka - takav i takav."

Događa se da je predložena metoda potpuno "skrojena" za otvorenu bazu podataka i ne radi na stvarnim podacima. S ovim čestim problemom možete se boriti otvaranjem novih, reprezentativnijih skupova podataka, no često je riječ o privatnim sadržajima koje tvrtke jednostavno nemaju pravo otvoriti. U nekim slučajevima provode (ponekad složenu i mukotrpnu) anonimizaciju podataka – uklanjaju sve fragmente koji upućuju na određenu osobu. Na primjer, lica i brojevi na fotografijama se brišu ili postaju nečitljivi. Osim toga, kako bi skup podataka ne samo bio dostupan svima, već postao standard među znanstvenicima na kojem je zgodno uspoređivati ​​ideje, potrebno ga je ne samo objaviti, već i napisati poseban citirani članak o to i njegove prednosti.

Još je gore kada nema otvorenih skupova podataka u temi koja se proučava. Tada recenzent može samo na vjeru prihvatiti rezultate koje je autor iznio. Teoretski, autor bi ih mogao čak i precijeniti i ostati neotkriven, ali u akademskom okruženju to je malo vjerojatno, jer se protivi želji velike većine znanstvenika da razvijaju znanost.

U brojnim područjima ML-a, uključujući računalni vid, također je uobičajeno priložiti poveznice na kod (obično na GitHub) uz članke. Sami članci ili sadrže vrlo malo koda ili su pseudokod. I tu opet nastaju poteškoće ako članak piše istraživač iz tvrtke, a ne sa sveučilišta. Prema zadanim postavkama, kod napisan u korporaciji ili startupu označen je NDA. Istraživači i njihovi kolege moraju naporno raditi kako bi odvojili kod koji se odnosi na ideju koja se opisuje od internih i svakako zatvorenih repozitorija.

Mogućnost objave također ovisi o relevantnosti odabrane teme. Relevantnost je u velikoj mjeri diktirana proizvodima i uslugama: ako je korporacija ili startup zainteresiran za izgradnju nove usluge ili poboljšanje postojeće na temelju ideje iz članka, to je plus.

Nagrada nazvana po Ilyi Segalovichu. Priča o informatici i lansiranju publikacija

Kao što je već spomenuto, radovi iz informatike rijetko se pišu sami. Ali u pravilu jedan od autora uloži mnogo više vremena i truda od ostalih. Njegov doprinos znanstvenim novitetima je najveći. U popisu autora takva osoba je navedena prva - au budućnosti, kada se poziva na članak, mogu ga samo spomenuti (na primjer, "Ivanov et al" - "Ivanov i drugi" u prijevodu s latinskog). No, iznimno su vrijedni i prilozi drugih - inače je nemoguće biti na popisu autora.

Postupak pregleda

Radovi se obično prestaju primati nekoliko mjeseci prije konferencije. Nakon što je članak poslan, recenzenti imaju 3-5 tjedana da ga pročitaju, ocijene i komentiraju. To se događa prema single blind sustavu, kada autori ne vide imena recenzenata, ili dvostruko slijepom, kada sami recenzenti ne vide imena autora. Druga se opcija smatra nepristranijom: nekoliko znanstvenih radova pokazalo je da popularnost autora utječe na odluku recenzenta. Na primjer, može smatrati da je znanstvenik s velikim brojem već objavljenih članaka a priori vrijedan više ocjene.

Štoviše, čak iu slučaju dvostruko slijepog recenzenta, recenzent će vjerojatno pogoditi autora ako rade u istom području. Osim toga, u trenutku recenzije članak je možda već objavljen u arXiv bazi podataka, najvećem repozitoriju znanstvenih radova. Organizatori konferencije to ne zabranjuju, ali preporučuju korištenje drugog naslova i drugačijeg sažetka u publikacijama za arXiv. Ali ako je članak tamo objavljen, i dalje ga neće biti teško pronaći.

Uvijek postoji nekoliko recenzenata koji ocjenjuju članak. Jednom od njih dodijeljena je uloga meta-recenzenta, koji mora samo pregledati presude svojih kolega i donijeti konačnu odluku. Ako se recenzenti ne slažu oko članka, meta-recenzent ga također može pročitati radi cjelovitosti.

Ponekad, nakon pregledavanja ocjene i komentara, autor ima priliku ući u raspravu s recenzentom; čak postoji mogućnost da ga se uvjeri da promijeni svoju odluku (ali takav sustav ne funkcionira za sve konferencije, a još manje je moguće ozbiljno utjecati na presudu). U raspravi se ne možete pozivati ​​na druge znanstvene radove, osim onih koji su već navedeni u članku. Možete samo "pomoći" recenzentu da bolje razumije sadržaj članka.

Nagrada nazvana po Ilyi Segalovichu. Priča o informatici i lansiranju publikacija

Konferencije i časopisi

Članci o informatici češće se šalju na konferencije nego u znanstvene časopise. To je zato što publikacije časopisa imaju zahtjeve koje je teže ispuniti, a postupak recenziranja može trajati mjesecima ili čak godinama. Informatika je vrlo brzo razvijajuće područje, pa autori obično nisu spremni toliko dugo čekati na objavu. No, članak koji je već prihvaćen za konferenciju može se dopuniti (primjerice detaljnijim prikazom rezultata) i objaviti u časopisu u kojem prostorna ograničenja nisu tako stroga.

Događanja na konferenciji

Format nazočnosti autora odobrenih članaka na skupu određuju recenzenti. Ako članak dobije zeleno svjetlo, tada vam se najčešće dodjeljuje stalak za plakate. Poster je statični slajd sa sažetkom članka i ilustracijama. Neke konferencijske sobe pune su dugih redova stalka za plakate. Autor provodi značajan dio svog vremena u blizini svog postera, komunicirajući sa znanstvenicima koji su zainteresirani za članak.

Nagrada nazvana po Ilyi Segalovichu. Priča o informatici i lansiranju publikacija

Nagrada nazvana po Ilyi Segalovichu. Priča o informatici i lansiranju publikacija

Nešto prestižnija opcija za sudjelovanje je munjeviti razgovor. Ako recenzenti smatraju da je članak vrijedan kratkog izvješća, autoru se daje oko tri minute da govori širokoj publici. S jedne strane, munjevit govor dobra je prilika da svoju ideju ispričate ne samo onima koji su se samoinicijativno zainteresirali za plakat. S druge strane, proaktivni posjetitelji postera su spremniji i više uronjeni u vašu specifičnu temu od prosječnog slušatelja u dvorani. Stoga, u brzom izvješću, još uvijek morate imati vremena da informirate ljude.

Nagrada nazvana po Ilyi Segalovichu. Priča o informatici i lansiranju publikacija

Obično, na kraju svog munjevitog govora, autori imenuju broj postera kako bi ga slušatelji mogli pronaći i bolje razumjeti članak.

Nagrada nazvana po Ilyi Segalovichu. Priča o informatici i lansiranju publikacija

Posljednja, najprestižnija opcija je poster plus potpuna prezentacija ideje, kada više nema potrebe za žurbom da ispričate priču.

Nagrada nazvana po Ilyi Segalovichu. Priča o informatici i lansiranju publikacija

Ali naravno, znanstvenici - uključujući autore odobrenih članaka - dolaze na sljedeću konferenciju ne samo da bi se pohvalili. Prvo, oni teže pronaći plakate koji se odnose na njihovo područje iz očitih razloga. I drugo, važno im je da prošire svoju listu kontakata u svrhu zajedničkog akademskog rada u budućnosti. Ovo nije lov - ili, barem, njegova prva faza, nakon koje barem slijedi obostrano korisna razmjena ideja, razvoja i zajednički rad na jednom ili više članaka.

Istovremeno, produktivan networking na vrhunskoj konferenciji otežan je zbog totalnog nedostatka slobodnog vremena. Ako je nakon cijelog dana provedenog na prezentacijama i raspravama na posterima znanstvenik smogao snage i već prebolio jet lag, onda odlazi na jedan od brojnih zabava. Domaćini su im korporacije - zbog toga zabave često imaju više lovački karakter. Istodobno, mnogi ih gosti uopće ne koriste za pronalazak novog posla, već, opet, za umrežavanje. Navečer više nema izvješća i plakata - lakše je "uhvatiti" stručnjaka koji vas zanima.

Nagrada nazvana po Ilyi Segalovichu. Priča o informatici i lansiranju publikacija

Od ideje do proizvodnje

Računarska znanost jedna je od rijetkih industrija u kojoj su interesi korporacija i startupa snažno povezani s akademskim okruženjem. NIPS, ICML i druge slične konferencije privlače puno ljudi iz industrije, ne samo sa sveučilišta. Ovo je tipično za područje računalnih znanosti, ali obrnuto za većinu drugih znanosti.

S druge strane, ne idu sve ideje predstavljene u člancima odmah prema stvaranju ili poboljšanju usluga. Čak i unutar jedne tvrtke, istraživač može kolegama iz službe predložiti ideju koja je prijelomna po znanstvenim standardima i dobiti odbijenicu da je realizira iz više razloga. Jedan od njih već je spomenut ovdje - to je razlika između “akademskog” skupa podataka na kojem je članak napisan i stvarnog skupa podataka. Osim toga, implementacija ideje može biti odgođena, zahtijevati veliku količinu resursa ili poboljšati samo jedan pokazatelj po cijenu pogoršanja ostalih metrika.

Nagrada nazvana po Ilyi Segalovichu. Priča o informatici i lansiranju publikacija

Situaciju spašava činjenica da su mnogi programeri i sami pomalo istraživači. Pohađaju konferencije, govore istim jezikom s akademicima, predlažu ideje, ponekad sudjeluju u stvaranju članaka (na primjer, pišu kod) ili čak i sami djeluju kao autori. Ako je programer uronjen u akademski proces, prati što se događa u istraživačkom odjelu, jednom riječju - ako pokazuje kontrakretanje prema znanstvenicima, tada se ciklus pretvaranja znanstvenih ideja u nove servisne mogućnosti skraćuje.

Svim mladim istraživačima želimo puno sreće i uspjeha u radu. Ako vam ovaj post nije rekao ništa novo, onda ste možda već objavili na vrhunskoj konferenciji. Registrirajte se za nagrada sami i imenovati znanstvene voditelje.

Izvor: www.habr.com

Dodajte komentar