Å odien mÄs atklÄjam Iļjas SegaloviÄa vÄrdÄ nosaukto zinÄtnisko balvu
PirmÄ apbalvoÅ”anas ceremonija notiks aprÄ«lÄ«. Balvas ietvaros jaunie zinÄtnieki saÅems 350 tÅ«kstoÅ”us rubļu, turklÄt viÅi varÄs doties uz starptautisku konferenci, strÄdÄt ar mentoru un iziet stažÄÅ”anos Yandex pÄtniecÄ«bas nodaļÄ. ZinÄtniskie vadÄ«tÄji saÅems 700 tÅ«kstoÅ”us rubļu.
Par godu balvas atklÄÅ”anai mÄs nolÄmÄm Å”eit, HabrĆ©, runÄt par panÄkumu kritÄrijiem datorzinÄtÅu pasaulÄ. Daži Habr lasÄ«tÄji jau ir iepazinuÅ”ies ar Å”iem kritÄrijiem, savukÄrt citiem par tiem var rasties maldÄ«gs priekÅ”stats. Å odien mÄs pÄrvarÄsim Å”o plaisu ā pieskarsimies visÄm galvenajÄm tÄmÄm, tostarp rakstiem, konferencÄm, datu kopÄm un zinÄtnisko ideju pÄrÅemÅ”anai pakalpojumos.
KÄpÄc publicÄt savas idejas
CilvÄkiem, kuri ir tÄlu no datorzinÄtnes, var rasties maldÄ«gs priekÅ”stats, ka vÄrtÄ«gÄkÄs idejas labÄk paturÄt noslÄpumÄ un censties gÅ«t peļÅu no to unikalitÄtes. TaÄu reÄlÄ situÄcija mÅ«su jomÄ ir tieÅ”i pretÄja. ZinÄtnieka autoritÄte tiek vÄrtÄta pÄc viÅa darbu nozÄ«mÄ«guma, pÄc tÄ, cik bieži viÅa rakstus citÄ citi zinÄtnieki (citÄcijas rÄdÄ«tÄjs). TÄ ir svarÄ«ga viÅa karjeras iezÄ«me. PÄtnieks virzÄs uz augÅ”u pa profesionÄlajÄm kÄpnÄm, kļūstot cienÄ«tÄkam savÄ sabiedrÄ«bÄ, tikai tad, ja viÅÅ” konsekventi izstrÄdÄ spÄcÄ«gus darbus, kas tiek publicÄti, kļūst slaveni un veido pamatu citu zinÄtnieku darbam.
Daudzi populÄrÄkie raksti (iespÄjams, lielÄkÄ daļa) ir dažÄdu universitÄÅ”u un uzÅÄmumu pÄtnieku sadarbÄ«bas rezultÄts visÄ pasaulÄ. SvarÄ«gs un ļoti vÄrtÄ«gs brÄ«dis pÄtnieka karjerÄ ir tas, kad viÅam ir iespÄja paÅ”am atrast un izsijÄt idejas, balstoties uz savu pieredzi, taÄu arÄ« pÄc tam kolÄÄ£i viÅam turpina sniegt nenovÄrtÄjamu palÄ«dzÄ«bu. ZinÄtnieki palÄ«dz viens otram attÄ«stÄ«t idejas, sadarbojoties raksta rakstus - un jo lielÄks zinÄtnieka ieguldÄ«jums zinÄtnÄ, jo vieglÄk viÅam atrast domubiedrus.
Visbeidzot, informÄcijas blÄ«vums un pieejamÄ«ba tagad ir tik liela, ka dažÄdi pÄtnieki vienlaikus nÄk klajÄ ar ļoti lÄ«dzÄ«gÄm (un patiesi vÄrtÄ«gÄm) zinÄtniskÄm idejÄm. Ja nepublicÄsit savu ideju, gandrÄ«z noteikti to jÅ«su vietÄ publicÄs kÄds cits. āUzvarÄtÄjsā bieži vien ir nevis tas, kurÅ” nÄca klajÄ ar jauninÄjumu nedaudz agrÄk, bet gan tas, kurÅ” to publicÄja nedaudz agrÄk. Vai arÄ« ā tas, kuram izdevÄs ideju atklÄt pÄc iespÄjas pilnÄ«gÄk, skaidrÄk un pÄrliecinoÅ”Äk.
Raksti un datu kopas
TÄtad zinÄtnisks raksts ir veidots, balstoties uz pÄtnieka piedÄvÄto galveno ideju. Å Ä« ideja ir viÅa ieguldÄ«jums datorzinÄtnÄs. Raksts sÄkas ar idejas aprakstu, kas formulÄts dažos teikumos. Tam seko ievads, kurÄ aprakstÄ«ts ar piedÄvÄtÄs inovÄcijas palÄ«dzÄ«bu atrisinÄto problÄmu loks. Apraksts un ievads parasti ir rakstÄ«ti vienkÄrÅ”Ä valodÄ, kas ir saprotama plaÅ”ai auditorijai. PÄc ievada nepiecieÅ”ams formalizÄt matemÄtiskÄ valodÄ izklÄstÄ«tÄs problÄmas un ieviest stingru notÄciju. PÄc tam, izmantojot ieviestos apzÄ«mÄjumus, jums ir jÄizveido skaidrs un visaptveroÅ”s izklÄsts par piedÄvÄtÄs inovÄcijas bÅ«tÄ«bu un jÄidentificÄ atŔķirÄ«bas no iepriekÅ”ÄjÄm, lÄ«dzÄ«gÄm metodÄm. Visi teorÄtiskie apgalvojumi ir vai nu jÄpamato ar atsaucÄm uz iepriekÅ” apkopotiem pierÄdÄ«jumiem, vai arÄ« jÄpierÄda neatkarÄ«gi. To var izdarÄ«t ar dažiem pieÅÄmumiem. PiemÄram, jÅ«s varat sniegt pierÄdÄ«jumu gadÄ«jumam, kad ir bezgalÄ«gi daudz apmÄcÄ«bas datu (acÄ«mredzami nesasniedzama situÄcija) vai tie ir pilnÄ«gi neatkarÄ«gi viens no otra. Raksta beigÄs zinÄtnieks stÄsta par eksperimentÄlajiem rezultÄtiem, ko viÅam izdevÄs iegÅ«t.
Lai konferences organizatoru piesaistÄ«tie recenzenti varÄtu biežÄk apstiprinÄt darbu, tam ir jÄbÅ«t vienam vai vairÄkiem atribÅ«tiem. Galvenais faktors, kas palielina apstiprinÄÅ”anas iespÄjas, ir ierosinÄtÄs idejas zinÄtniskÄ novitÄte. Bieži vien novitÄte tiek vÄrtÄta saistÄ«bÄ ar jau esoÅ”Äm idejÄm ā un tÄ izvÄrtÄÅ”anas darbu veic nevis recenzents, bet gan pats raksta autors. IdeÄlÄ gadÄ«jumÄ autoram rakstÄ vajadzÄtu detalizÄti pastÄstÄ«t par esoÅ”ajÄm metodÄm un, ja iespÄjams, izklÄstÄ«t tÄs kÄ savas metodes Ä«paÅ”os gadÄ«jumus. TÄdÄjÄdi zinÄtnieks parÄda, ka pieÅemtÄs pieejas ne vienmÄr darbojas, ka viÅÅ” tÄs vispÄrinÄja un piedÄvÄja plaÅ”Äku, elastÄ«gÄku un lÄ«dz ar to arÄ« efektÄ«vÄku teorÄtisko formulÄjumu. Ja jaunums ir nenoliedzams, tad citÄdi recenzenti rakstu vÄrtÄ ne tik izvÄlÄ«gi - piemÄram, var pievÄrt acis uz vÄju angļu valodu.
Lai pastiprinÄtu novitÄti, ir lietderÄ«gi vienÄ vai vairÄkÄs datu kopÄs iekļaut salÄ«dzinÄjumu ar esoÅ”ajÄm metodÄm. Katram no tiem jÄbÅ«t atvÄrtiem un pieÅemtiem akadÄmiskajÄ vidÄ. PiemÄram, ir ImageNet attÄlu repozitorijs un tÄdu institÅ«tu kÄ ModificÄtais NacionÄlais standartu un tehnoloÄ£iju institÅ«ts (MNIST) un CIFAR (KanÄdas progresÄ«vo pÄtÄ«jumu institÅ«ts) datu bÄzes. GrÅ«tÄ«bas ir tÄdas, ka Å”Äda āakadÄmiskaā datu kopa satura struktÅ«rÄ bieži atŔķiras no reÄlajiem datiem, ar kuriem nodarbojas nozare. DažÄdi dati nozÄ«mÄ dažÄdus piedÄvÄtÄs metodes rezultÄtus. ZinÄtnieki, kas daļÄji strÄdÄ nozarÄ, cenÅ”as to Åemt vÄrÄ un dažkÄrt ievieto atrunas, piemÄram, āuz mÅ«su datiem rezultÄts ir tÄds un tÄds, bet publiskajÄ datu kopÄ ā tÄds un tÄdsā.
GadÄs, ka piedÄvÄtÄ metode ir pilnÄ«bÄ āpielÄgotaā atvÄrtai datu bÄzei un nedarbojas uz reÄliem datiem. JÅ«s varat cÄ«nÄ«ties ar Å”o izplatÄ«to problÄmu, atverot jaunas, reprezentatÄ«vÄkas datu kopas, taÄu bieži vien mÄs runÄjam par privÄtu saturu, kuru uzÅÄmumiem vienkÄrÅ”i nav tiesÄ«bu atvÄrt. Dažos gadÄ«jumos viÅi veic (dažreiz sarežģītu un rÅ«pÄ«gu) datu anonimizÄciju - noÅem visus fragmentus, kas norÄda uz konkrÄtu personu. PiemÄram, sejas un cipari fotogrÄfijÄs tiek izdzÄsti vai padarÄ«ti nesalasÄmi. TurklÄt, lai datu kopa ne tikai bÅ«tu pieejama ikvienam, bet kļūtu par standartu zinÄtnieku vidÅ«, par kuru ir Ärti salÄ«dzinÄt idejas, ir nepiecieÅ”ams ne tikai to publicÄt, bet arÄ« uzrakstÄ«t atseviŔķu citÄtu rakstu par tas un tÄ priekÅ”rocÄ«bas.
SliktÄk ir, ja pÄtÄmajÄ tÄmÄ nav atvÄrtu datu kopu. Tad recenzents var pieÅemt tikai autora sniegtos rezultÄtus par ticÄ«bu. TeorÄtiski autors tos varÄtu pat pÄrvÄrtÄt un palikt nepamanÄ«ts, taÄu akadÄmiskÄ vidÄ tas ir maz ticams, jo tas ir pretrunÄ lielÄkÄs daļas zinÄtnieku vÄlmei attÄ«stÄ«t zinÄtni.
VairÄkÄs ML jomÄs, tostarp datorredzÄ, ir izplatÄ«ta arÄ« saiÅ”u pievienoÅ”ana kodam (parasti GitHub) ar rakstiem. PaÅ”os rakstos vai nu ir ļoti maz koda, vai arÄ« tie ir pseidokods. Un te atkal rodas grÅ«tÄ«bas, ja rakstu raksta pÄtnieks no uzÅÄmuma, nevis augstskolas. PÄc noklusÄjuma korporÄcijÄ vai startÄÅ”anas programmÄ rakstÄ«tais kods ir apzÄ«mÄts ar NDA. PÄtniekiem un viÅu kolÄÄ£iem ir smagi jÄstrÄdÄ, lai atdalÄ«tu kodu, kas saistÄ«ts ar aprakstÄ«to ideju, no iekÅ”ÄjÄm un noteikti slÄgtÄm krÄtuvÄm.
PublicÄÅ”anas iespÄja ir atkarÄ«ga arÄ« no izvÄlÄtÄs tÄmas atbilstÄ«bas. AtbilstÄ«bu lielÄ mÄrÄ nosaka produkti un pakalpojumi: ja korporÄcija vai jaunuzÅÄmums ir ieinteresÄts izveidot jaunu pakalpojumu vai uzlabot esoÅ”u, pamatojoties uz ideju no raksta, tas ir pluss.
KÄ jau minÄts, datorzinÄtÅu darbi reti tiek rakstÄ«ti vienatnÄ. Bet parasti viens no autoriem pavada daudz vairÄk laika un pūļu nekÄ citi. ViÅa ieguldÄ«jums zinÄtniskajÄ novitÄtÄ ir vislielÄkais. Autoru sarakstÄ Å”Äda persona ir norÄdÄ«ta vispirms - un turpmÄk, atsaucoties uz rakstu, viÅi var tikai pieminÄt viÅu (piemÄram, āIvanov et alā - āIvanovs un citiā tulkojumÄ no latÄ«Åu valodas). TaÄu ÄrkÄrtÄ«gi vÄrtÄ«gs ir arÄ« citu devums ā citÄdi nav iespÄjams tikt autoru sarakstÄ.
PÄrskatÄ«Å”anas process
Rakstus parasti pÄrtrauc pieÅemt vairÄkus mÄneÅ”us pirms konferences. PÄc raksta iesniegÅ”anas recenzentiem ir 3ā5 nedÄļas, lai to izlasÄ«tu, novÄrtÄtu un komentÄtu. Tas notiek pÄc vienotÄs aklÄs sistÄmas, kad autori neredz recenzentu vÄrdus, vai dubultaklÄ, kad paÅ”i recenzenti neredz autoru vÄrdus. Otrais variants tiek uzskatÄ«ts par objektÄ«vÄku: vairÄki zinÄtniskie darbi ir parÄdÄ«juÅ”i, ka autora popularitÄte ietekmÄ recenzenta lÄmumu. PiemÄram, viÅÅ” var uzskatÄ«t, ka zinÄtnieks ar lielu skaitu jau publicÄtu rakstu a priori ir augstÄka vÄrtÄjuma cienÄ«gs.
TurklÄt pat dubultaklÄ gadÄ«jumÄ recenzents, iespÄjams, uzminÄs autoru, ja viÅi strÄdÄ tajÄ paÅ”Ä jomÄ. TurklÄt pÄrskatÄ«Å”anas laikÄ raksts jau var bÅ«t publicÄts arXiv datubÄzÄ, kas ir lielÄkÄ zinÄtnisko rakstu krÄtuve. Konferences organizatori to neaizliedz, taÄu viÅi iesaka izmantot citu nosaukumu un citu kopsavilkumu publikÄcijÄs par arXiv. Bet, ja raksts tika ievietots tur, to atrast joprojÄm nebÅ«s grÅ«ti.
VienmÄr ir vairÄki recenzenti, kas novÄrtÄ rakstu. Vienam no viÅiem ir pieŔķirta metarecenzenta loma, kuram tikai jÄpÄrskata kolÄÄ£u spriedumi un jÄpieÅem galÄ«gais lÄmums. Ja recenzentiem nav vienprÄtÄ«bas par rakstu, arÄ« metarecenzents var to izlasÄ«t, lai nodroÅ”inÄtu pilnÄ«gumu.
DažkÄrt pÄc vÄrtÄjuma un komentÄru iepazÄ«Å”anas autoram ir iespÄja iesaistÄ«ties diskusijÄ ar recenzentu; ir pat iespÄja pÄrliecinÄt viÅu mainÄ«t savu lÄmumu (tomÄr Å”Äda sistÄma nedarbojas visÄs konferencÄs, un vÄl mazÄk ir iespÄjams nopietni ietekmÄt spriedumu). DiskusijÄ jÅ«s nevarat atsaukties uz citiem zinÄtniskiem darbiem, izÅemot tos, kas jau ir minÄti rakstÄ. JÅ«s varat tikai āpalÄ«dzÄtā recenzentam labÄk izprast raksta saturu.
Konferences un žurnÄli
DatorzinÄtnes raksti biežÄk tiek iesniegti konferencÄs, nevis zinÄtniskos žurnÄlos. Tas ir tÄpÄc, ka žurnÄlu publikÄcijÄm ir prasÄ«bas, kuras ir grÅ«tÄk izpildÄ«t, un salÄ«dzinoÅ”Äs pÄrskatÄ«Å”anas process var ilgt mÄneÅ”us vai pat gadus. DatorzinÄtne ir ļoti strauji mainÄ«ga joma, tÄpÄc autori parasti nav gatavi tik ilgi gaidÄ«t publicÄÅ”anu. TaÄu rakstu, kas jau ir pieÅemts konferencei, pÄc tam var papildinÄt (piemÄram, prezentÄjot detalizÄtÄkus rezultÄtus) un publicÄt žurnÄlÄ, kurÄ telpas ierobežojumi nav tik stingri.
PasÄkumi konferencÄ
ApstiprinÄto rakstu autoru klÄtbÅ«tnes formÄtu konferencÄ nosaka recenzenti. Ja rakstam tiek dota zaÄ¼Ä gaisma, tad jums visbiežÄk tiek pieŔķirts plakÄtu stends. PlakÄts ir statisks slaids ar raksta kopsavilkumu un ilustrÄcijÄm. Dažas konferenÄu telpas ir piepildÄ«tas ar garÄm plakÄtu stendu rindÄm. Autors ievÄrojamu sava laika daļu pavada pie sava plakÄta, sazinoties ar zinÄtniekiem, kurus interesÄ raksts.
Nedaudz prestižÄks dalÄ«bas variants ir zibenÄ«ga saruna. Ja recenzenti uzskata rakstu par Ätras atskaites cienÄ«gu, autoram tiek dotas apmÄram trÄ«s minÅ«tes, lai runÄtu ar plaÅ”u auditoriju. No vienas puses, zibens saruna ir laba iespÄja pastÄstÄ«t par savu ideju ne tikai tiem, kas par plakÄtu ieinteresÄjuÅ”ies pÄc savas iniciatÄ«vas. No otras puses, proaktÄ«vie plakÄtu apmeklÄtÄji ir vairÄk sagatavoti un vairÄk iedziļinÄjuÅ”ies jÅ«su konkrÄtajÄ tÄmÄ nekÄ vidusmÄra klausÄ«tÄjs zÄlÄ. TÄpÄc ÄtrajÄ pÄrskatÄ jums joprojÄm ir nepiecieÅ”ams laiks, lai informÄtu cilvÄkus par jaunÄkajÄm aktualitÄtÄm.
Parasti savas zibenÄ«gÄs sarunas beigÄs autori nosauc plakÄta numuru, lai klausÄ«tÄji to varÄtu atrast un labÄk izprast rakstu.
PÄdÄjais, prestižÄkais variants ir plakÄts plus pilnvÄrtÄ«ga idejas prezentÄcija, kad vairs nav jÄsteidzas ar stÄsta stÄstÄ«Å”anu.
Bet, protams, zinÄtnieki ā arÄ« apstiprinÄto rakstu autori ā nÄk uz nÄkamo konferenci ne tikai dižoties. PirmkÄrt, viÅi mÄdz atrast plakÄtus, kas saistÄ«ti ar viÅu jomu acÄ«mredzamu iemeslu dÄļ. Un, otrkÄrt, viÅiem ir svarÄ«gi paplaÅ”inÄt savu kontaktu sarakstu kopÄ«ga akadÄmiskÄ darba nolÅ«kos nÄkotnÄ. Å Ä«s nav medÄ«bas ā vai vismaz tÄs pirmais posms, kam vismaz seko abpusÄji izdevÄ«ga domu apmaiÅa, attÄ«stÄ«ba un kopÄ«gs darbs pie viena vai vairÄkiem rakstiem.
TajÄ paÅ”Ä laikÄ produktÄ«va tÄ«kla veidoÅ”ana augstÄkÄ lÄ«meÅa konferencÄ ir apgrÅ«tinÄta pilnÄ«ga brÄ«vÄ laika trÅ«kuma dÄļ. Ja pÄc veselas dienas, kas pavadÄ«ta prezentÄcijÄs un diskusijÄs pie plakÄtiem, zinÄtnieks ir saglabÄjis spÄkus un jau pÄrvarÄjis jet lag, tad viÅÅ” dodas uz kÄdu no daudzajÄm ballÄ«tÄm. Tos rÄ«ko korporÄcijas ā lÄ«dz ar to ballÄ«tÄm nereti ir medÄ«gÄks raksturs. TajÄ paÅ”Ä laikÄ daudzi viesi tos izmanto nevis, lai atrastu jaunu darbu, bet gan atkal tÄ«kla veidoÅ”anai. VakarÄ vairs nav atskaiÅ”u un plakÄtu - interesÄjoÅ”Ä speciÄlista ānoÄ·ertā ir vieglÄk.
No idejas līdz ražoŔanai
DatorzinÄtne ir viena no retajÄm nozarÄm, kur korporÄciju un jaunuzÅÄmumu intereses ir cieÅ”i saistÄ«tas ar akadÄmisko vidi. NIPS, ICML un citas lÄ«dzÄ«gas konferences piesaista daudz cilvÄku no nozares, ne tikai no universitÄtÄm. Tas ir raksturÄ«gi datorzinÄtÅu jomai, bet otrÄdi vairumam citu zinÄtÅu.
No otras puses, ne visas rakstos izklÄstÄ«tÄs idejas uzreiz virzÄs uz pakalpojumu izveidi vai uzlaboÅ”anu. Pat viena uzÅÄmuma ietvaros pÄtnieks var piedÄvÄt kolÄÄ£iem no dienesta ideju, kas ir revolucionÄrs pÄc zinÄtnes standartiem, un saÅemt atteikumu to Ä«stenot vairÄku iemeslu dÄļ. Viens no tiem jau ir minÄts Å”eit - tÄ ir atŔķirÄ«ba starp āakadÄmiskoā datu kopu, uz kuras tika rakstÄ«ts raksts, un reÄlo datu kopu. TurklÄt idejas Ä«stenoÅ”ana var aizkavÄties, prasÄ«t lielus resursus vai uzlabot tikai vienu rÄdÄ«tÄju uz citu rÄdÄ«tÄju pasliktinÄÅ”anÄs rÄÄ·ina.
SituÄciju glÄbj tas, ka daudzi izstrÄdÄtÄji paÅ”i ir mazliet pÄtnieki. ViÅi apmeklÄ konferences, runÄ vienÄ valodÄ ar akadÄmiÄ·iem, piedÄvÄ idejas, dažreiz piedalÄs rakstu veidoÅ”anÄ (piemÄram, raksta kodu) vai pat paÅ”i darbojas kÄ autori. Ja izstrÄdÄtÄjs ir iegrimis akadÄmiskajÄ procesÄ, seko lÄ«dzi pÄtniecÄ«bas daÄ¼Ä notiekoÅ”ajam, vÄrdu sakot - ja viÅÅ” demonstrÄ pretvirzienu pret zinÄtniekiem, tad saÄ«sinÄs cikls, kÄ zinÄtniskÄs idejas pÄrvÄrstas jaunÄs servisa spÄjÄs.
NovÄlam visiem jaunajiem pÄtniekiem veiksmi un lieliskus sasniegumus darbÄ. Ja Ŕī ziÅa jums nepateica neko jaunu, iespÄjams, jÅ«s jau esat publicÄjis labÄko konferencÄ. ReÄ£istrÄties par
Avots: www.habr.com