Ilja Segalovitši nimeline auhind. Lugu arvutiteadusest ja väljaannetest

Ilja Segalovitši nimeline auhind. Lugu arvutiteadusest ja väljaannetest

Täna anname välja Ilja Segalovitši nimelise teadusauhinna iseg. See antakse välja saavutuste eest arvutiteaduse valdkonnas. Bakalaureuse- ja magistriõppe üliõpilased saavad auhinna saamiseks esitada oma taotluse või nimetada teaduslikud juhendajad. Laureaadid valivad akadeemilise kogukonna ja Yandexi esindajad. Peamised valikukriteeriumid: publikatsioonid ja ettekanded konverentsidel, samuti panus kogukonna arengusse.

Esimene auhinnatseremoonia toimub aprillis. Auhinna raames saavad noored teadlased 350 tuhat rubla ning lisaks saavad nad minna rahvusvahelisele konverentsile, töötada koos mentoriga ja läbida praktika Yandexi uurimisosakonnas. Teaduslikud juhendajad saavad 700 tuhat rubla.

Auhinna avamise puhul otsustasime siin Habres rääkida edu kriteeriumidest arvutiteaduse maailmas. Mõned Habri lugejad on nende kriteeriumidega juba tuttavad, samas kui teistel võib neist jääda vale mulje. Täna ületame selle lõhe – puudutame kõiki peamisi teemasid, sealhulgas artikleid, konverentse, andmekogusid ja teaduslike ideede ülekandmist teenustesse.

Arvutiteaduse valdkonna teadlaste jaoks on peamiseks edukriteeriumiks nende teadustööde avaldamine ühel rahvusvahelisel tippkonverentsil. See on esimene "kontrollpunkt" teadlase töö tunnustamiseks. Näiteks masinõppe valdkonnas üldiselt eristatakse rahvusvahelist masinõppe konverentsi (ICML) ja neuronaalsete teabetöötlussüsteemide konverentsi (NeurIPS, varem NIPS). Toimub palju konverentse, mis käsitlevad ML spetsiifilisi valdkondi, nagu arvutinägemine, infootsing, kõnetehnoloogia, masintõlge jne.

Miks oma ideid avaldada

Arvutiteadusest kaugel olevatel inimestel võib olla eksiarvamus, et kõige väärtuslikumad ideed on parem hoida saladuses ja püüda nende ainulaadsusest kasu saada. Tegelik olukord meie valdkonnas on aga täpselt vastupidine. Teadlase autoriteeti hinnatakse tema tööde olulisuse järgi, selle järgi, kui sageli teised teadlased tema artikleid tsiteerivad (tsiteerimisindeks). See on tema karjääri oluline omadus. Teadlane liigub professionaalsel redelil ülespoole, saades oma kogukonnas rohkem lugupidamist vaid siis, kui ta teeb järjekindlalt tugevat tööd, mis avaldatakse, saab kuulsaks ja on aluseks teiste teadlaste tööle.

Paljud tippartiklid (võib-olla enamik) on valminud erinevate ülikoolide ja ettevõtete teadlaste koostööst üle maailma. Oluline ja väga väärtuslik hetk teadlase karjääris on see, kui ta saab võimaluse oma kogemuste põhjal ise ideid leida ja välja sõeluda – kuid ka pärast seda jätkavad kolleegid talle hindamatut abi. Teadlased aitavad üksteisel ideid arendada, koostöös artikleid kirjutada – ja mida suurem on teadlase panus teadusesse, seda lihtsam on tal leida mõttekaaslasi.

Lõpuks on teabe tihedus ja kättesaadavus praegu nii suur, et erinevad teadlased tulevad üheaegselt välja väga sarnaste (ja tõeliselt väärtuslike) teaduslike ideedega. Kui te oma ideed ei avalda, avaldab selle teie eest peaaegu kindlasti keegi teine. “Võitja” pole sageli see, kes uuendusega veidi varem välja tuli, vaid see, kes selle veidi varem avaldas. Või - ​​see, kellel õnnestus idee võimalikult täielikult, selgelt ja veenvalt paljastada.

Ilja Segalovitši nimeline auhind. Lugu arvutiteadusest ja väljaannetest

Artiklid ja andmestikud

Seega on teadusartikkel üles ehitatud teadlase pakutud põhiidee ümber. See idee on tema panus arvutiteadusesse. Artikkel algab idee kirjeldusega, mis on sõnastatud mõne lausega. Sellele järgneb sissejuhatus, mis kirjeldab kavandatava uuenduse abil lahendatud probleeme. Kirjeldus ja sissejuhatus on tavaliselt kirjutatud lihtsas, laiale publikule arusaadavas keeles. Pärast sissejuhatust on vaja vormistada matemaatilises keeles esitatavad ülesanded ja võtta kasutusele range tähistus. Seejärel tuleb kasutusele võetud tähiste abil luua selge ja põhjalik ülevaade kavandatava uuenduse olemusest ning tuvastada erinevused varasematest sarnastest meetoditest. Kõiki teoreetilisi väiteid tuleb kas toetada viidetega varem koostatud tõenditele või need peavad olema iseseisvalt tõestatud. Seda saab teha teatud eeldustega. Näiteks saab anda tõestuse juhuks, kui treeningandmeid on lõputult palju (ilmselgelt kättesaamatu olukord) või need on üksteisest täiesti sõltumatud. Artikli lõpu poole räägib teadlane katsetulemustest, mis tal õnnestus saada.

Ilja Segalovitši nimeline auhind. Lugu arvutiteadusest ja väljaannetest

Selleks, et konverentsi korraldajate värvatud retsensendid saaksid töö tõenäolisemalt heaks kiita, peab sellel olema üks või mitu atribuuti. Peamine tegur, mis suurendab heakskiitmise võimalusi, on pakutud idee teaduslik uudsus. Sageli hinnatakse uudsust seoses juba olemasolevate ideedega – ja selle hindamise tööd ei tee retsensent, vaid artikli autor ise. Ideaalis peaks autor artiklis üksikasjalikult rääkima olemasolevatest meetoditest ja võimalusel esitama need oma meetodi erijuhtudena. Seega näitab teadlane, et aktsepteeritud lähenemisviisid ei tööta alati, et ta üldistas need ja pakkus välja laiema, paindlikuma ja seetõttu tõhusama teoreetilise sõnastuse. Kui uudsus on vaieldamatu, siis muidu hindavad arvustajad artiklit mitte nii valivalt – näiteks võivad nad kehva inglise keele ees silma kinni pigistada.

Uudsuse tugevdamiseks on kasulik lisada ühele või mitmele andmekogumile võrdlus olemasolevate meetoditega. Igaüks neist peaks olema avatud ja akadeemilises keskkonnas aktsepteeritud. Näiteks on olemas ImageNeti pildihoidla ja selliste instituutide andmebaasid nagu Modified National Institute of Standards and Technology (MNIST) ja CIFAR (Canadian Institute for Advanced Research). Raskus seisneb selles, et selline "akadeemiline" andmestik erineb sageli sisustruktuurilt tegelikest andmetest, millega tööstus tegeleb. Erinevad andmed tähendavad pakutud meetodi erinevaid tulemusi. Teadlased, kes osaliselt töötavad tööstuses, püüavad seda arvesse võtta ja sisestavad mõnikord selliseid klausleid nagu "meie andmetel on tulemus selline ja selline, kuid avaliku andmestiku puhul - selline ja selline."

Juhtub, et pakutud meetod on täielikult "kohandatud" avatud andmebaasiga ega tööta reaalsete andmetega. Selle levinud probleemiga saate võidelda uute esinduslikumate andmekogumite avamisega, kuid sageli räägime privaatsest sisust, mida ettevõtetel lihtsalt pole õigust avada. Mõnel juhul viivad nad läbi (mõnikord keeruka ja vaevarikka) andmete anonüümseks muutmise – eemaldavad kõik killud, mis viitavad konkreetsele isikule. Näiteks fotodel olevad näod ja numbrid kustutatakse või muudetakse loetamatuks. Lisaks on selleks, et andmestik poleks mitte ainult kõigile kättesaadav, vaid muutuks teadlaste seas standardiks, mille põhjal on mugav ideid võrrelda, mitte ainult see avaldada, vaid ka kirjutada selle kohta eraldi viidatud artikkel. see ja selle eelised.

See on hullem, kui uuritavas teemas pole avatud andmekogumeid. Siis saab retsensent aktsepteerida ainult autori usupõhiselt esitatud tulemusi. Teoreetiliselt võib autor neid isegi üle hinnata ja jääda märkamatuks, kuid akadeemilises keskkonnas on see ebatõenäoline, kuna see läheb vastuollu suure enamuse teadlaste sooviga teadust arendada.

Mitmetes ML-i valdkondades, sealhulgas arvutinägemises, on levinud ka linkide lisamine koodile (tavaliselt GitHubile) koos artiklitega. Artiklid ise sisaldavad kas väga vähe koodi või on pseudokood. Ja siin tekivad jällegi raskused, kui artikli on kirjutanud ettevõtte, mitte ülikooli teadlane. Vaikimisi on ettevõttes või startupis kirjutatud kood sildiga NDA. Teadlased ja nende kolleegid peavad kõvasti tööd tegema, et eraldada kirjeldatava ideega seotud kood sisemistest ja kindlasti suletud hoidlatest.

Avaldamise võimalus sõltub ka valitud teema asjakohasusest. Asjakohasuse määravad suuresti tooted ja teenused: kui ettevõte või idufirma on huvitatud uue teenuse loomisest või olemasoleva täiustamisest artikli idee põhjal, on see pluss.

Ilja Segalovitši nimeline auhind. Lugu arvutiteadusest ja väljaannetest

Nagu juba mainitud, kirjutatakse informaatikatöid harva üksi. Kuid reeglina kulutab üks autoritest palju rohkem aega ja vaeva kui teised. Tema panus teaduslikku uudsusse on suurim. Autorite loendis on selline isik märgitud kõigepealt - ja edaspidi saavad nad artiklile viidates ainult teda mainida (näiteks "Ivanov jt" - ladina keelest tõlgitud "Ivanov ja teised"). Äärmiselt väärtuslikud on aga ka teiste kaastööd – muidu pole võimalik autorite nimekirjas olla.

Ülevaatusprotsess

Paberite vastuvõtmine lõpetatakse tavaliselt mitu kuud enne konverentsi. Pärast artikli esitamist on retsensenditel aega 3–5 nädalat selle lugemiseks, hindamiseks ja kommenteerimiseks. See toimub ühe pimeda süsteemi järgi, kui autorid ei näe arvustajate nimesid, või topeltpime, kui arvustajad ise ei näe autorite nimesid. Teist võimalust peetakse erapooletumaks: mitmed teadustööd on näidanud, et autori populaarsus mõjutab arvustaja otsust. Näiteks võib ta arvata, et teadlane, kellel on palju juba avaldatud artikleid, on a priori väärt kõrgemat hinnangut.

Veelgi enam, isegi topeltpimeduse puhul arvab arvustaja tõenäoliselt autori ära, kui nad töötavad samal alal. Lisaks võib artikkel läbivaatamise ajal olla juba avaldatud andmebaasis arXiv, mis on suurim teadustööde hoidla. Konverentsi korraldajad seda ei keela, kuid soovitavad kasutada arXivi väljaannetes teistsugust pealkirja ja teistsugust kokkuvõtet. Aga kui artikkel sinna postitati, pole selle leidmine ikkagi keeruline.

Artiklit hindab alati mitu arvustajat. Ühele neist on määratud metaretsenseerija roll, kes peab üle vaatama vaid kolleegide otsused ja langetama lõpliku otsuse. Kui arvustajad on artikli osas eriarvamusel, võib metaretsenseerija seda ka täielikkuse huvides lugeda.

Mõnikord on autoril pärast hinnangu ja kommentaaridega tutvumist võimalus asuda arvustajaga diskussiooni; on isegi võimalus veenda teda oma otsust muutma (kõigi konverentside puhul selline süsteem siiski ei tööta ja veelgi vähem on võimalik kohtuotsust tõsiselt mõjutada). Arutelus ei saa te viidata teistele teadustöödele, välja arvatud need, millele artiklis on juba viidatud. Saate ainult "aidata" retsensendil artikli sisu paremini mõista.

Ilja Segalovitši nimeline auhind. Lugu arvutiteadusest ja väljaannetest

Konverentsid ja ajakirjad

Arvutiteaduse artikleid esitatakse sagedamini konverentsidele kui teadusajakirjadele. Selle põhjuseks on asjaolu, et ajakirjade väljaannete nõuded on keerulisemad ja vastastikuse eksperdihinnangu protsess võib kesta kuid või isegi aastaid. Arvutiteadus on väga kiiresti arenev valdkond, mistõttu autorid ei ole tavaliselt nõus avaldamist nii kaua ootama. Konverentsile juba vastu võetud artiklit saab aga seejärel täiendada (näiteks täpsemate tulemuste esitamisega) ja avaldada ajakirjas, kus ruumipiirangud pole nii ranged.

Sündmused konverentsil

Heakskiidetud artiklite autorite konverentsil viibimise vormi määravad retsensendid. Kui artiklile antakse roheline tuli, eraldatakse teile kõige sagedamini plakatite stend. Plakat on staatiline slaid artikli kokkuvõtte ja illustratsioonidega. Mõned konverentsiruumid on täis pikki plakatialuseid. Autor veedab olulise osa ajast oma plakati läheduses, suheldes artiklist huvitatud teadlastega.

Ilja Segalovitši nimeline auhind. Lugu arvutiteadusest ja väljaannetest

Ilja Segalovitši nimeline auhind. Lugu arvutiteadusest ja väljaannetest

Veidi prestiižsem võimalus osalemiseks on välkjutt. Kui retsensendid peavad artiklit kiiraruande vääriliseks, antakse autorile umbes kolm minutit, et rääkida laiale publikule. Ühest küljest on välkvestlus hea võimalus oma ideest rääkida mitte ainult neile, kes omal algatusel plakati vastu huvi tundsid. Teisalt on proaktiivsed plakatikülastajad rohkem valmis ja süvenenud teie konkreetsesse teemasse kui keskmine kuulaja saalis. Seetõttu peab kiiraruandes siiski olema aega, et inimesi kursis hoida.

Ilja Segalovitši nimeline auhind. Lugu arvutiteadusest ja väljaannetest

Tavaliselt nimetavad autorid välgukõne lõpus plakati numbri, et kuulajad selle üles leiaksid ja artiklist paremini aru saaksid.

Ilja Segalovitši nimeline auhind. Lugu arvutiteadusest ja väljaannetest

Viimane, kõige prestiižsem variant on plakat pluss idee täisväärtuslik esitlus, kui pole enam vaja loo jutustamisega kiirustada.

Ilja Segalovitši nimeline auhind. Lugu arvutiteadusest ja väljaannetest

Kuid loomulikult tulevad teadlased – sealhulgas heakskiidetud artiklite autorid – järgmisele konverentsile mitte ainult uhkeldama. Esiteks kipuvad nad ilmselgetel põhjustel leidma oma valdkonnaga seotud plakateid. Ja teiseks on neil oluline edaspidi oma kontaktide nimekirja laiendada ühise akadeemilise töö eesmärgil. See ei ole jaht – või vähemalt selle kõige esimene etapp, millele vähemalt järgneb vastastikku kasulik ideede vahetus, arengud ja ühine töö ühe või mitme artikli kallal.

Samas on produktiivne võrgustumine tippkonverentsil raske vaba aja täieliku nappuse tõttu. Kui pärast tervet päeva ettekannetel ja plakatitel arutledes on teadlane jõudu säilitanud ja jet lagist juba üle saanud, läheb ta ühele paljudest pidudest. Neid võõrustavad korporatsioonid – seetõttu on peod sageli jahilikuma iseloomuga. Samal ajal kasutavad paljud külalised neid mitte uue töö leidmiseks, vaid jällegi võrgustike loomiseks. Õhtul pole enam aruandeid ja plakateid - huvipakkuvat spetsialisti on lihtsam “püüda”.

Ilja Segalovitši nimeline auhind. Lugu arvutiteadusest ja väljaannetest

Ideest tootmiseni

Arvutiteadus on üks väheseid majandusharusid, kus korporatsioonide ja idufirmade huvid on tugevalt seotud akadeemilise keskkonnaga. NIPS, ICML ja muud sarnased konverentsid meelitavad kohale palju inimesi tööstusest, mitte ainult ülikoolidest. See on tüüpiline arvutiteaduse valdkonnale, kuid vastupidi enamikule teistele teadustele.

Teisest küljest ei lähe kõik artiklites esitatud ideed kohe teenuste loomisele või täiustamisele. Isegi ühe ettevõtte sees võib teadlane kolleegidele teenistusest välja pakkuda teaduse standardite järgi läbimurdelise idee ja saada mitmel põhjusel selle elluviimisest keeldumise. Ühte neist on siin juba mainitud - see on erinevus "akadeemilise" andmekogumi, mille põhjal artikkel on kirjutatud, ja tegeliku andmekogumi vahel. Lisaks võib idee elluviimine viibida, nõuda palju ressursse või parandada ainult ühte näitajat teiste mõõdikute halvenemise hinnaga.

Ilja Segalovitši nimeline auhind. Lugu arvutiteadusest ja väljaannetest

Olukorra päästab see, et paljud arendajad ise on veidi uurijad. Nad käivad konverentsidel, räägivad akadeemikutega ühte keelt, pakuvad välja ideid, osalevad mõnikord artiklite loomisel (näiteks koodi kirjutamisel) või tegutsevad isegi ise autoritena. Kui arendaja sukeldub akadeemilisse protsessi, jälgib teadusosakonnas toimuvat, ühesõnaga - kui ta demonstreerib vastuliikumist teadlaste poole, siis lüheneb teadusideede uuteks teenindusvõimeteks muutmise tsükkel.

Soovime kõigile noortele teadlastele edu ja suuri saavutusi nende töös. Kui see postitus teile midagi uut ei öelnud, olete võib-olla juba tippkonverentsil avaldanud. Registreeru lisatasu ise ja nimetada teaduslikud juhendajad.

Allikas: www.habr.com

Lisa kommentaar