Premio nomita laŭ Ilja Segaloviĉ. Rakonto pri komputiko kaj lanĉaj publikaĵoj

Premio nomita laŭ Ilja Segaloviĉ. Rakonto pri komputiko kaj lanĉaj publikaĵoj

Hodiaŭ ni lanĉas sciencan premion nomitan laŭ Ilja Segaloviĉ iseg. Ĝi estos aljuĝita por atingoj en la kampo de komputiko. Studentoj de bakalaŭra kaj postbakalaŭra povas sendi sian propran peton por la premio aŭ nomumu sciencajn kontrolistojn. La premiitoj estos elektitaj de reprezentantoj de la akademia komunumo kaj Yandex. La ĉefaj elektkriterioj: publikaĵoj kaj prezentoj ĉe konferencoj, same kiel kontribuo al la evoluo de la komunumo.

La unua premia ceremonio okazos en aprilo. Kadre de la premio, junaj sciencistoj ricevos 350 mil rublojn, kaj krome ili povos iri al internacia konferenco, labori kun mentoro kaj sperti staĝon en la esplorfako Yandex. Sciencaj kontrolistoj ricevos 700 mil rublojn.

Okaze de la lanĉo de la premio, ni decidis paroli ĉi tie ĉe Habré pri la kriterioj por sukceso en la mondo de komputiko. Iuj Habr-legantoj jam konas ĉi tiujn kriteriojn, dum aliaj eble havas malveran impreson pri ili. Hodiaŭ ni transpontos ĉi tiun breĉon - ni tuŝos ĉiujn ĉefajn temojn, inkluzive de artikoloj, konferencoj, datumaroj kaj transdono de sciencaj ideoj en servojn.

Por sciencistoj en la kampo de komputiko, la ĉefa kriterio por sukceso estas la publikigo de ilia scienca laboro ĉe unu el la ĉefaj internaciaj konferencoj. Ĉi tiu estas la unua "kontrolpunkto" por rekoni la laboron de la esploristo. Ekzemple, en la kampo de maŝina lernado ĝenerale, la Internacia Konferenco pri Maŝina Lernado (ICML) kaj la Konferenco pri Neural Information Processing Systems (NeurIPS, antaŭe NIPS) estas distingitaj. Ekzistas multaj konferencoj pri specifaj areoj de ML, kiel komputila vizio, informserĉado, parolteknologio, maŝintradukado ktp.

Kial publikigi viajn ideojn

Homoj, kiuj estas malproksimaj de komputiko, eble havas la miskomprenon, ke estas pli bone sekretigi la plej valorajn ideojn kaj klopodi profiti el ilia unikeco. Tamen, la reala situacio en nia kampo estas ĝuste la malo. La aŭtoritato de sciencisto estas taksata laŭ la signifo de liaj verkoj, laŭ kiom ofte liaj artikoloj estas cititaj de aliaj sciencistoj (cita indekso). Ĉi tio estas grava karakterizaĵo de lia kariero. Esploristo supreniras la profesian ŝtuparon, fariĝante pli respektata en sia komunumo, nur se li konstante produktas fortan laboron kiu estas publikigita, iĝas fama, kaj formas la bazon por la laboro de aliaj sciencistoj.

Multaj ĉefaj artikoloj (eble plej multaj) estas la rezulto de kunlaboro inter esploristoj en malsamaj universitatoj kaj kompanioj tra la mondo. Grava kaj tre valora momento en la kariero de esploristo estas kiam li havas la ŝancon mem trovi kaj kribri ideojn surbaze de sia sperto - sed eĉ post tio liaj kolegoj daŭre donas al li valoregan helpon. Sciencistoj helpas unu la alian evoluigi ideojn, verkas artikolojn kunlabore - kaj ju pli granda la kontribuo de la sciencisto al scienco, des pli facile estas por li trovi samideanojn.

Fine, la denseco kaj havebleco de informoj nun estas tiom grandaj, ke malsamaj esploristoj samtempe elpensas tre similajn (kaj vere valorajn) sciencajn ideojn. Se vi ne publikigas vian ideon, iu alia preskaŭ certe publikigos ĝin por vi. La "gajninto" ofte ne estas tiu, kiu iom pli frue elpensis la novigon, sed tiu, kiu publikigis ĝin iom pli frue. Aŭ — tiu, kiu sukcesis malkaŝi la ideon kiel eble plej plene, klare kaj konvinke.

Premio nomita laŭ Ilja Segaloviĉ. Rakonto pri komputiko kaj lanĉaj publikaĵoj

Artikoloj kaj datumaroj

Do, scienca artikolo estas konstruita ĉirkaŭ la ĉefa ideo, kiun la esploristo proponas. Tiu ĉi ideo estas lia kontribuo al komputiko. La artikolo komenciĝas per priskribo de la ideo, formulita en kelkaj frazoj. Sekvas enkonduko, kiu priskribas la gamon da problemoj solvitaj helpe de la proponita novigado. La priskribo kaj enkonduko estas kutime skribitaj en simpla lingvo komprenebla por vasta publiko. Post la enkonduko, necesas formaligi la problemojn prezentitajn en matematika lingvo kaj enkonduki striktan notacion. Tiam, uzante la enkondukitajn notaciojn, vi devas krei klaran kaj ampleksan deklaron de la esenco de la proponita novigado, kaj identigi la diferencojn de antaŭaj similaj metodoj. Ĉiuj teoriaj deklaroj devas aŭ esti apogitaj per referencoj al antaŭe kompilitaj indicoj, aŭ pruvitaj sendepende. Ĉi tio povas esti farita kun iuj supozoj. Ekzemple, vi povas doni pruvon por la kazo kiam estas senfina kvanto da trejnaj datumoj (evidente neatingebla situacio) aŭ ili estas tute sendependaj unu de la alia. Al la fino de la artikolo, la sciencisto parolas pri la eksperimentaj rezultoj, kiujn li povis akiri.

Premio nomita laŭ Ilja Segaloviĉ. Rakonto pri komputiko kaj lanĉaj publikaĵoj

Por ke la recenzistoj rekrutitaj de la konferencaj organizantoj pli probable aprobu artikolon, ĝi devas havi unu aŭ plurajn atributojn. Ŝlosila faktoro, kiu pliigas la ŝancojn de aprobo, estas la scienca noveco de la proponita ideo. Ofte oni taksas novecon rilate jam ekzistantajn ideojn – kaj la taksadon de ĝi faras ne la recenzisto, sed la aŭtoro de la artikolo mem. Ideale, la aŭtoro rakontu detale en la artikolo pri ekzistantaj metodoj kaj, se eble, prezentu ilin kiel specialajn kazojn de sia metodo. Tiel, la sciencisto montras, ke la akceptitaj aliroj ne ĉiam funkcias, ke li ĝeneraligis ilin kaj proponis pli larĝan, pli flekseblan kaj do pli efikan teorian formuliĝon. Se la noveco estas nekontestebla, tiam alie recenzistoj taksas la artikolon ne tiom elekteme - ekzemple ili povas blindigi la okulojn al malbona angla.

Por plifortigi novecon, estas utile inkluzivi komparon kun ekzistantaj metodoj sur unu aŭ pluraj datumaroj. Ĉiu el ili estu malfermita kaj akceptita en la akademia medio. Ekzemple, ekzistas la ImageNet-bilddeponejo kaj datumbazoj de tiaj institutoj kiel la Modifita Nacia Instituto de Normoj kaj Teknologio (MNIST) kaj CIFAR (Kanada Instituto Por Altnivela Esplorado). La malfacileco estas, ke tia "akademia" datumaro ofte diferencas en enhavstrukturo de la realaj datumoj, pri kiuj la industrio traktas. Malsamaj datumoj signifas malsamajn rezultojn de la proponita metodo. Sciencistoj, kiuj parte laboras por la industrio, provas konsideri tion kaj foje enmeti malgarantiojn kiel "en niaj datumoj la rezulto estas tia kaj tia, sed en la publika datumaro - tia kaj tia."

Okazas, ke la proponita metodo estas tute "tajlorita" al malferma datumbazo kaj ne funkcias sur realaj datumoj. Vi povas kontraŭbatali ĉi tiun komunan problemon malfermante novajn pli reprezentajn datumajn arojn, sed ofte ni parolas pri privata enhavo, kiun kompanioj simple ne rajtas malfermi. En iuj kazoj, ili faras (foje kompleksan kaj zorgeman) anonimigon de datumoj - ili forigas iujn ajn fragmentojn kiuj montras al specifa persono. Ekzemple, vizaĝoj kaj nombroj en fotoj estas forigitaj aŭ igitaj nelegeblaj. Krome, por ke la datumaro ne nur estu disponebla por ĉiuj, sed fariĝu normo inter sciencistoj, pri kiu konvenas kompari ideojn, necesas ne nur publikigi ĝin, sed ankaŭ verki apartan cititan artikolon pri ĝi kaj ĝiaj avantaĝoj.

Pli malbonas kiam ne estas malfermitaj datumaroj en la studata temo. Tiam la recenzisto povas akcepti nur la rezultojn prezentitajn de la aŭtoro pri fido. Teorie, la aŭtoro povus eĉ supertaksi ilin kaj resti nerimarkita, sed en akademia medio tio estas neverŝajna, ĉar ĝi kontraŭas la deziron de la granda plimulto de sciencistoj disvolvi sciencon.

En kelkaj areoj de ML, inkluzive de komputila vizio, estas ankaŭ ofta ligi ligilojn al kodo (kutime al GitHub) kun artikoloj. La artikoloj mem aŭ enhavas tre malmulte da kodo aŭ estas pseŭdokodo. Kaj ĉi tie denove aperas malfacilaĵoj, se la artikolo estas verkita de esploristo de firmao, kaj ne de universitato. Defaŭlte, kodo skribita en korporacio aŭ starto estas etikedita NDA. Esploristoj kaj siaj kolegoj devas multe klopodi por apartigi la kodon rilatan al la priskribata ideo de internaj kaj certe fermitaj deponejoj.

La ebleco de publikigo ankaŭ dependas de la graveco de la elektita temo. Graveco estas plejparte diktita de produktoj kaj servoj: se korporacio aŭ noventrepreno interesiĝas pri konstruado de nova servo aŭ plibonigo de ekzistanta surbaze de ideo de artikolo, tio estas pluso.

Premio nomita laŭ Ilja Segaloviĉ. Rakonto pri komputiko kaj lanĉaj publikaĵoj

Kiel jam menciite, komputilaj artikoloj malofte estas verkitaj sole. Sed kiel regulo, unu el la aŭtoroj elspezas multe pli da tempo kaj penado ol la aliaj. Lia kontribuo al scienca noveco estas la plej granda. En la listo de aŭtoroj, tia persono estas indikita unue - kaj estonte, kiam oni raportas al artikolo, ili nur povas mencii lin (ekzemple "Ivanov et al" - "Ivanov kaj aliaj" tradukita el la latina). Tamen ankaŭ la kontribuoj de aliaj estas ege valoraj – alie ne eblas esti en la listo de aŭtoroj.

Procezo de revizio

Artikoloj kutime ĉesas esti akceptitaj plurajn monatojn antaŭ la konferenco. Post kiam artikolo estas sendita, recenzistoj havas 3–5 semajnojn por legi, taksi kaj komenti ĝin. Tio okazas laŭ la unublinda sistemo, kiam la aŭtoroj ne vidas la nomojn de la recenzistoj, aŭ la duoble blindulon, kiam la recenzistoj mem ne vidas la nomojn de la aŭtoroj. La dua opcio estas konsiderata pli senpartia: pluraj sciencaj artikoloj montris, ke la populareco de la aŭtoro influas la decidon de la recenzisto. Ekzemple, li povas konsideri, ke sciencisto kun granda nombro da jam publikigitaj artikoloj estas apriore inda je pli alta takso.

Krome, eĉ en la kazo de duobla blindulo, la recenzisto verŝajne divenos la aŭtoron, se ili laboras en la sama fako. Krome, en la momento de la revizio, la artikolo eble jam estas publikigita en la datumbazo arXiv, la plej granda deponejo de sciencaj artikoloj. Konferencaj organizantoj ne malpermesas tion, sed ili rekomendas uzi alian titolon kaj alian abstraktaĵon en publikaĵoj por arXiv. Sed se la artikolo estis afiŝita tie, ankoraŭ ne estos malfacile trovi ĝin.

Ĉiam estas pluraj recenzistoj taksantaj artikolon. Al unu el ili estas asignita la rolo de meta-reviziisto, kiu devas nur revizii la verdiktojn de siaj kolegoj kaj fari la finan decidon. Se la recenzistoj malkonsentas pri la artikolo, la meta-recenzisto ankaŭ povas legi ĝin por kompleteco.

Kelkfoje, post revizio de la taksado kaj komentoj, la aŭtoro havas la ŝancon eniri diskuton kun la recenzisto; estas eĉ ŝanco konvinki lin ŝanĝi lian decidon (tamen tia sistemo ne funkcias por ĉiuj konferencoj, kaj eĉ malpli eblas serioze influi la verdikton). En la diskuto, vi ne povas rilati al aliaj sciencaj verkoj, escepte de tiuj jam referencitaj en la artikolo. Vi nur povas "helpi" la recenziston pli bone kompreni la enhavon de la artikolo.

Premio nomita laŭ Ilja Segaloviĉ. Rakonto pri komputiko kaj lanĉaj publikaĵoj

Konferencoj kaj revuoj

Komputilaj artikoloj estas pli ofte sendataj al konferencoj ol al sciencaj revuoj. Ĉi tio estas ĉar ĵurnalaj publikaĵoj havas postulojn, kiuj estas pli malfacile plenumi, kaj la kolega revizia procezo povas daŭri monatojn aŭ eĉ jarojn. Komputiko estas tre rapide moviĝanta kampo, do aŭtoroj kutime ne pretas atendi tiom longe por publikigo. Tamen, artikolo kiu jam estis akceptita por la konferenco povas tiam esti kompletigita (ekzemple, prezentante pli detalaj rezultoj) kaj publikigita en revuo kie spaclimigoj ne estas tiel striktaj.

Eventoj en la konferenco

La formato por la ĉeesto de aŭtoroj de aprobitaj artikoloj ĉe la konferenco estas determinita de la recenzistoj. Se la artikolo ricevas la verdan lumon, tiam vi estas plej ofte asignita afiŝa stando. Afiŝo estas senmova diapozitivo kun resumo de la artikolo kaj ilustraĵoj. Kelkaj konferencaj salonoj estas plenigitaj per longaj vicoj da afiŝostandoj. La aŭtoro pasigas gravan parton de sia tempo proksime de sia afiŝo, komunikante kun sciencistoj, kiuj interesiĝas pri la artikolo.

Premio nomita laŭ Ilja Segaloviĉ. Rakonto pri komputiko kaj lanĉaj publikaĵoj

Premio nomita laŭ Ilja Segaloviĉ. Rakonto pri komputiko kaj lanĉaj publikaĵoj

Iom pli prestiĝa elekto por partopreno estas fulma parolado. Se la recenzistoj konsideras la artikolon inda je rapida raporto, la aŭtoro ricevas ĉirkaŭ tri minutojn por paroli al larĝa publiko. Unuflanke, fulma parolado estas bona okazo rakonti pri via ideo ne nur al tiuj, kiuj memvole interesiĝis pri la afiŝo. Aliflanke, aktivaj afiŝovizitantoj estas pli pretaj kaj pli mergitaj en via specifa temo ol la averaĝa aŭskultanto en la salono. Tial, en rapida raporto, vi ankoraŭ bezonas havi tempon por ĝisdatigi homojn.

Premio nomita laŭ Ilja Segaloviĉ. Rakonto pri komputiko kaj lanĉaj publikaĵoj

Kutime, ĉe la fino de sia fulma parolado, aŭtoroj nomas la afiŝonumeron por ke la aŭskultantoj povu trovi ĝin kaj pli bone kompreni la artikolon.

Premio nomita laŭ Ilja Segaloviĉ. Rakonto pri komputiko kaj lanĉaj publikaĵoj

La lasta, plej prestiĝa opcio estas afiŝo plus plentaŭga prezento de la ideo, kiam ne plu necesas rapidi por rakonti la historion.

Premio nomita laŭ Ilja Segaloviĉ. Rakonto pri komputiko kaj lanĉaj publikaĵoj

Sed kompreneble sciencistoj - inkluzive de la aŭtoroj de aprobitaj artikoloj - venas al la venonta konferenco ne nur por montri. Unue, ili emas trovi afiŝojn rilatajn al sia kampo pro evidentaj kialoj. Kaj due, estas grave por ili estonte pligrandigi sian liston de kontaktoj por komuna akademia laboro. Ĉi tio ne estas ĉasado – aŭ, almenaŭ, ĝia unua etapo, kiu estas almenaŭ sekvata de reciproke utila interŝanĝo de ideoj, evoluoj kaj komuna laboro pri unu aŭ pluraj artikoloj.

Samtempe, produktiva interkonektado ĉe pinta konferenco malfacilas pro la tuta manko de libera tempo. Se, post tuta tago pasigita ĉe prezentoj kaj en diskutoj ĉe afiŝoj, la sciencisto konservis sian forton kaj jam venkis jetlagon, tiam li iras al unu el la multaj partioj. Ili estas gastigitaj de korporacioj - kiel rezulto, la partioj ofte havas pli ĉasan karakteron. Samtempe multaj gastoj uzas ilin tute ne por trovi novan laboron, sed, denove, por interkonektado. Vespere ne plu estas raportoj kaj afiŝoj - estas pli facile "kapti" la specialiston, pri kiu vi interesiĝas.

Premio nomita laŭ Ilja Segaloviĉ. Rakonto pri komputiko kaj lanĉaj publikaĵoj

De ideo ĝis produktado

Komputado estas unu el la malmultaj industrioj kie la interesoj de korporacioj kaj noventreprenoj estas forte ligitaj al la akademia medio. NIPS, ICML kaj aliaj similaj konferencoj allogas multajn homojn de industrio, ne nur universitatoj. Ĉi tio estas tipa por la fako de komputiko, sed inverse por la plej multaj aliaj sciencoj.

Aliflanke, ne ĉiuj ideoj prezentitaj en artikoloj tuj iras al kreado aŭ plibonigo de servoj. Eĉ ene de unu firmao, esploristo povas proponi al kolegoj de la servo ideon, kiu estas trarompa laŭ sciencaj normoj kaj ricevi rifuzon efektivigi ĝin pro kelkaj kialoj. Unu el ili jam estis menciita ĉi tie - jen la diferenco inter la "akademia" datumaro, sur kiu la artikolo estis skribita, kaj la reala datumaro. Krome, la efektivigo de ideo povas esti prokrastita, postuli grandan kvanton da rimedoj aŭ plibonigi nur unu indikilon koste de malboniĝo de aliaj metrikoj.

Premio nomita laŭ Ilja Segaloviĉ. Rakonto pri komputiko kaj lanĉaj publikaĵoj

La situacio estas savita de la fakto, ke multaj programistoj mem estas iom da esploristoj. Ili ĉeestas konferencojn, parolas la saman lingvon kun akademianoj, proponas ideojn, foje partoprenas en la kreado de artikoloj (ekzemple verkado de kodo), aŭ eĉ rolas kiel aŭtoroj mem. Se programisto estas mergita en la akademia procezo, sekvas tion, kio okazas en la esplorsekcio, unuvorte - se li pruvas kontraŭmovadon al sciencistoj, tiam la ciklo de ŝanĝado de sciencaj ideoj en novajn servajn kapablojn estas mallongigita.

Ni deziras al ĉiuj junaj esploristoj bonan sorton kaj grandajn atingojn en sia laboro. Se ĉi tiu afiŝo ne diris al vi ion novan, tiam vi eble jam publikigis en pinta konferenco. Registru por premio mem kaj nomumu sciencajn kontrolistojn.

fonto: www.habr.com

Aldoni komenton