Verðlaun nefnd eftir Ilya Segalovich. Saga um tölvunarfræði og útgáfurit

Verðlaun nefnd eftir Ilya Segalovich. Saga um tölvunarfræði og útgáfurit

Í dag erum við að hleypa af stokkunum vísindaverðlaunum sem kennd eru við Ilya Segalovich iseg. Það verður veitt fyrir árangur á sviði tölvunarfræði. Nemendur í grunn- og framhaldsnámi geta lagt fram eigin umsókn um verðlaunin eða tilnefna vísindalega leiðbeinendur. Verðlaunahafarnir verða valdir af fulltrúum fræðasamfélagsins og Yandex. Helstu valviðmið: útgáfur og kynningar á ráðstefnum, sem og framlag til þróunar samfélagsins.

Fyrsta verðlaunaafhendingin fer fram í apríl. Sem hluti af verðlaununum fá ungir vísindamenn 350 þúsund rúblur og að auki geta þeir farið á alþjóðlega ráðstefnu, unnið með leiðbeinanda og farið í starfsnám í Yandex rannsóknardeild. Vísindalegir umsjónarmenn fá 700 þúsund rúblur.

Í tilefni af því að verðlaunin voru hleypt af stokkunum ákváðum við að ræða hér á Habré um forsendur fyrir árangri í tölvunarfræðiheiminum. Sumir lesendur Habr kannast nú þegar við þessi viðmið, á meðan aðrir gætu haft ranga mynd af þeim. Í dag munum við brúa þetta bil - við munum snerta öll helstu efni, þar á meðal greinar, ráðstefnur, gagnasöfn og yfirfærslu vísindahugmynda í þjónustu.

Fyrir vísindamenn á sviði tölvunarfræði er aðalviðmiðun árangurs birting vísindastarfa þeirra á einni af efstu alþjóðlegu ráðstefnunum. Þetta er fyrsta „eftirlitsstöðin“ til að viðurkenna verk rannsakandans. Til dæmis, á sviði vélanáms almennt, eru alþjóðleg ráðstefna um vélanám (ICML) og ráðstefna um taugaupplýsingavinnslukerfi (NeurIPS, áður NIPS) aðgreindar. Það eru margar ráðstefnur um ákveðin svið ML, svo sem tölvusjón, upplýsingaleit, taltækni, vélþýðingu o.fl.

Af hverju að birta hugmyndir þínar

Fólk sem er fjarri tölvunarfræði kann að hafa þann misskilning að betra sé að halda verðmætustu hugmyndunum leyndum og leitast við að hagnast á sérstöðu þeirra. Hins vegar er raunverulegt ástand á okkar sviði nákvæmlega hið gagnstæða. Vald vísindamanns er metið eftir mikilvægi verka hans, eftir því hversu oft aðrir vísindamenn vitna í greinar hans (tilvitnunarskrá). Þetta er mikilvægur eiginleiki á ferli hans. Rannsakandi færist upp á fagstigann og fær meiri virðingu í samfélagi sínu, aðeins ef hann framleiðir stöðugt sterkt verk sem er gefið út, verður frægt og myndar grunninn að starfi annarra vísindamanna.

Margar helstu greinar (kannski flestar) eru afrakstur samvinnu vísindamanna við mismunandi háskóla og fyrirtæki um allan heim. Mikilvægt og mjög dýrmætt augnablik á ferli rannsakanda er þegar hann fær tækifæri til að finna og sigta hugmyndir upp á eigin spýtur út frá reynslu sinni - en jafnvel eftir þetta halda samstarfsmenn hans áfram að veita honum ómetanlega aðstoð. Vísindamenn hjálpa hver öðrum að þróa hugmyndir, skrifa greinar í samvinnu - og því meira framlag vísindamannsins til vísindanna, því auðveldara er fyrir hann að finna svipað hugarfar.

Að lokum er þéttleiki og aðgengi upplýsinga nú svo mikill að mismunandi vísindamenn koma samtímis með mjög svipaðar (og sannarlega verðmætar) vísindalegar hugmyndir. Ef þú birtir ekki hugmyndina þína mun einhver annar næstum örugglega birta hana fyrir þig. „Sigurvegarinn“ er oft ekki sá sem kom með nýjungina aðeins fyrr, heldur sá sem birti hana aðeins fyrr. Eða - sá sem tókst að opinbera hugmyndina eins fyllilega, skýrt og sannfærandi og hægt er.

Verðlaun nefnd eftir Ilya Segalovich. Saga um tölvunarfræði og útgáfurit

Greinar og gagnasafn

Svo, vísindagrein er byggð í kringum meginhugmyndina sem rannsakandinn leggur til. Þessi hugmynd er framlag hans til tölvunarfræðinnar. Greinin hefst á lýsingu á hugmyndinni sem er sett fram í nokkrum setningum. Því næst kemur kynning sem lýsir fjölda vandamála sem leyst eru með hjálp fyrirhugaðrar nýsköpunar. Lýsingin og inngangurinn er venjulega skrifaður á einföldu máli sem er skiljanlegt fyrir breiðan markhóp. Eftir innganginn er nauðsynlegt að formfesta þau vandamál sem sett eru fram í stærðfræðimáli og taka upp stranga nótnaskrift. Síðan, með því að nota innleiddu nótnirnar, þarftu að búa til skýra og yfirgripsmikla yfirlýsingu um kjarna fyrirhugaðrar nýsköpunar og greina muninn frá fyrri, svipuðum aðferðum. Allar fræðilegar staðhæfingar verða annaðhvort að vera studdar með tilvísunum í áður söfnuð sönnunargögn eða sannað sjálfstætt. Þetta gæti verið gert með einhverjum forsendum. Til dæmis geturðu gefið sönnun fyrir málinu þegar það er óendanlega mikið af þjálfunargögnum (augljóslega óviðunandi aðstæður) eða þau eru algjörlega óháð hvort öðru. Undir lok greinarinnar talar vísindamaðurinn um tilraunaniðurstöðurnar sem honum tókst að fá.

Verðlaun nefnd eftir Ilya Segalovich. Saga um tölvunarfræði og útgáfurit

Til þess að gagnrýnendur sem skipuleggjendur ráðstefnunnar ráðnir séu líklegri til að samþykkja ritgerð verður það að hafa einn eða fleiri eiginleika. Lykilatriði sem eykur líkurnar á samþykki er vísindaleg nýbreytni fyrirhugaðrar hugmyndar. Oft er nýnæmi metið í tengslum við hugmyndir sem þegar eru til – og matsvinnan er ekki unnin af gagnrýnanda heldur greinarhöfundi sjálfum. Helst ætti höfundur að segja ítarlega frá núverandi aðferðum í greininni og, ef hægt er, setja þær fram sem sérstök dæmi um aðferð sína. Þannig sýnir vísindamaðurinn að viðteknar nálganir virka ekki alltaf, að hann alhæfði þær og lagði til breiðari, sveigjanlegri og þar af leiðandi áhrifaríkari fræðilega mótun. Ef nýjungin er óumdeilanleg, þá meta gagnrýnendur greinina ekki svo vandlega - til dæmis gætu þeir lokað augunum fyrir lélegri ensku.

Til að styrkja nýjungar er gagnlegt að hafa samanburð við núverandi aðferðir á einu eða fleiri gagnasettum. Hver þeirra ætti að vera opin og viðurkennd í akademísku umhverfi. Til dæmis er ImageNet myndageymslan og gagnagrunnar slíkra stofnana eins og Modified National Institute of Standards and Technology (MNIST) og CIFAR (Canadian Institute for Advanced Research). Erfiðleikarnir eru að slíkt „fræðilegt“ gagnasafn er oft frábrugðið efnisskipulagi frá raunverulegum gögnum sem iðnaðurinn fæst við. Mismunandi gögn þýða mismunandi niðurstöður fyrirhugaðrar aðferðar. Vísindamenn sem starfa að hluta til fyrir iðnaðinn reyna að taka tillit til þessa og setja stundum inn fyrirvara eins og „á gögnum okkar er niðurstaðan svona og svona, en á opinberu gagnasafninu – svona og svo.

Það gerist að fyrirhuguð aðferð er algjörlega „sniðin“ að opnum gagnagrunni og virkar ekki á raunverulegum gögnum. Hægt er að berjast gegn þessu algenga vandamáli með því að opna ný og dæmigerðri gagnasöfn, en oft erum við að tala um einkaefni sem fyrirtæki hafa einfaldlega ekki rétt á að opna. Í sumum tilfellum framkvæma þeir (stundum flókna og vandlega) nafnleynd gagna - þeir fjarlægja öll brot sem vísa á tiltekinn einstakling. Til dæmis eru andlit og tölur á ljósmyndum eytt eða gerð ólæsileg. Að auki, til þess að gagnasafnið sé ekki aðeins aðgengilegt fyrir alla, heldur verði staðall meðal vísindamanna sem auðvelt er að bera saman hugmyndir um, er nauðsynlegt ekki aðeins að birta það, heldur einnig að skrifa sérstaka grein sem vitnað er í um. það og kosti þess.

Það er verra þegar það eru engin opin gagnasöfn í efninu sem verið er að rannsaka. Þá getur gagnrýnandi aðeins samþykkt niðurstöður sem höfundur leggur fram um trú. Fræðilega séð gæti höfundurinn jafnvel ofmetið þær og verið ógreindar, en í akademísku umhverfi er það ólíklegt, þar sem það gengur þvert á vilja langflestra vísindamanna til að þróa vísindi.

Á nokkrum sviðum ML, þar á meðal tölvusjón, er einnig algengt að tengla við kóða (venjulega á GitHub) með greinum. Greinarnar sjálfar innihalda annað hvort mjög lítinn kóða eða eru gervikóði. Og hér koma aftur upp erfiðleikar ef greinin er skrifuð af fræðimanni frá fyrirtæki, en ekki frá háskóla. Sjálfgefið er að kóði sem skrifaður er í fyrirtæki eða gangsetningu er merktur NDA. Rannsakendur og samstarfsmenn þeirra þurfa að vinna hörðum höndum að því að aðgreina kóðann sem tengist hugmyndinni sem lýst er frá innri og örugglega lokuðum geymslum.

Möguleiki á birtingu fer einnig eftir mikilvægi þess efnis sem valið er. Mikilvægi ræðst að miklu leyti af vörum og þjónustu: ef fyrirtæki eða sprotafyrirtæki hefur áhuga á að byggja upp nýja þjónustu eða bæta núverandi út frá hugmynd úr grein, þá er það plús.

Verðlaun nefnd eftir Ilya Segalovich. Saga um tölvunarfræði og útgáfurit

Eins og áður hefur komið fram eru tölvunarfræðirit sjaldan skrifuð ein. En að jafnaði eyðir einn höfundanna mun meiri tíma og fyrirhöfn en hinir. Framlag hans til vísindalegra nýjunga er hið mesta. Í listanum yfir höfunda er slíkur einstaklingur tilgreindur fyrst - og í framtíðinni, þegar vísað er til greinar, geta þeir aðeins nefnt hann (til dæmis "Ivanov et al" - "Ivanov og aðrir" þýtt úr latínu). Framlag annarra er þó líka afskaplega dýrmætt - annars er ómögulegt að vera á höfundalistanum.

Endurskoðunarferli

Erindi hætta venjulega að vera samþykkt nokkrum mánuðum fyrir ráðstefnuna. Eftir að grein er send inn hafa gagnrýnendur 3–5 vikur til að lesa, meta og gera athugasemdir við hana. Þetta gerist samkvæmt einblindakerfinu, þegar höfundar sjá ekki nöfn gagnrýnenda, eða tvíblindur, þegar gagnrýnendur sjá sjálfir ekki nöfn höfunda. Annar kosturinn er talinn hlutlausari: nokkrar vísindagreinar hafa sýnt að vinsældir höfundar hafa áhrif á ákvörðun gagnrýnandans. Til dæmis gæti hann litið svo á að vísindamaður með mikinn fjölda þegar birtra greina sé fyrirfram verðugur að fá hærri einkunn.

Þar að auki, jafnvel ef um tvíblindu er að ræða, mun gagnrýnandi líklega giska á höfundinn ef þeir starfa á sama sviði. Þar að auki, við yfirferð, gæti greinin þegar verið birt í arXiv gagnagrunninum, stærsta geymsla vísindagreina. Ráðstefnuhaldarar banna þetta ekki, en þeir mæla með því að nota annan titil og annan ágrip í útgáfum fyrir arXiv. En ef greinin var sett þar, þá verður samt ekki erfitt að finna hana.

Það eru alltaf nokkrir gagnrýnendur sem meta grein. Einum þeirra er úthlutað hlutverki meta-gagnrýnanda, sem þarf aðeins að fara yfir dóma samstarfsmanna sinna og taka endanlega ákvörðun. Ef gagnrýnendur eru ósammála um greinina getur metagagnrýnandi einnig lesið hana til fullnustu.

Stundum, eftir að hafa farið yfir einkunn og athugasemdir, hefur höfundur tækifæri til að fara í umræður við gagnrýnandann; það er jafnvel möguleiki á að sannfæra hann um að breyta ákvörðun sinni (slíkt kerfi virkar hins vegar ekki fyrir allar ráðstefnur og það er enn síður hægt að hafa alvarleg áhrif á dóminn). Í umræðunni er ekki hægt að vísa í önnur vísindarit, að undanskildum þeim sem þegar er vísað til í greininni. Þú getur aðeins „hjálpað“ gagnrýnandanum að skilja innihald greinarinnar betur.

Verðlaun nefnd eftir Ilya Segalovich. Saga um tölvunarfræði og útgáfurit

Ráðstefnur og tímarit

Tölvunarfræðigreinar eru oftar sendar á ráðstefnur en í vísindatímarit. Þetta er vegna þess að tímaritsútgáfur hafa kröfur sem erfiðara er að uppfylla og ritrýniferlið getur tekið mánuði eða jafnvel ár. Tölvunarfræði er mjög hraðvirkt svið og því eru höfundar yfirleitt ekki tilbúnir að bíða svo lengi eftir birtingu. Hins vegar er síðan hægt að bæta við grein sem þegar hefur verið samþykkt fyrir ráðstefnuna (til dæmis með því að kynna ítarlegri niðurstöður) og birta í tímariti þar sem plásstakmarkanir eru ekki svo strangar.

Viðburðir á ráðstefnunni

Form fyrir viðveru höfunda samþykktra greina á ráðstefnunni er ákveðið af gagnrýnendum. Ef greinin fær grænt ljós þá er oftast úthlutað veggspjaldastandi. Veggspjald er kyrrstæð glæra með samantekt á greininni og myndskreytingum. Sumir ráðstefnusalir eru fullir af löngum röðum af veggspjaldastandum. Höfundur eyðir verulegum hluta tíma síns nálægt veggspjaldi sínu, í samskiptum við vísindamenn sem hafa áhuga á greininni.

Verðlaun nefnd eftir Ilya Segalovich. Saga um tölvunarfræði og útgáfurit

Verðlaun nefnd eftir Ilya Segalovich. Saga um tölvunarfræði og útgáfurit

Örlítið virtari valkostur fyrir þátttöku er eldingarspjall. Ef gagnrýnendur telja greinina verðuga að skjóta skýrslu, fær höfundur um það bil þrjár mínútur til að tala til breiðs áhorfenda. Annars vegar er eldingarspjall gott tækifæri til að segja frá hugmynd þinni ekki aðeins þeim sem fengu áhuga á plakatinu að eigin frumkvæði. Á hinn bóginn eru fyrirbyggjandi veggspjaldagestir tilbúnari og meira á kafi í tilteknu efni þínu en venjulegur hlustandi í salnum. Þess vegna, í fljótlegri skýrslu, þarftu samt að hafa tíma til að uppfæra fólk.

Verðlaun nefnd eftir Ilya Segalovich. Saga um tölvunarfræði og útgáfurit

Venjulega, í lok eldingarræðunnar, nefna höfundar númer veggspjaldsins svo að hlustendur geti fundið það og skilið greinina betur.

Verðlaun nefnd eftir Ilya Segalovich. Saga um tölvunarfræði og útgáfurit

Síðasti, virtasti kosturinn er veggspjald auk fullgildrar kynningar á hugmyndinni, þegar ekki er lengur þörf á að flýta sér að segja söguna.

Verðlaun nefnd eftir Ilya Segalovich. Saga um tölvunarfræði og útgáfurit

En auðvitað koma vísindamenn - þar á meðal höfundar samþykktra greina - á næstu ráðstefnu ekki bara til að láta sjá sig. Í fyrsta lagi hafa þeir tilhneigingu til að finna veggspjöld sem tengjast sínu sviði af augljósum ástæðum. Og í öðru lagi er mikilvægt fyrir þá að stækka tengiliðalistann í þeim tilgangi að geta sameiginlegt fræðilegt starf í framtíðinni. Þetta er ekki veiði - eða að minnsta kosti fyrsta stig hennar, sem er að minnsta kosti fylgt eftir með gagnkvæmu skiptast á hugmyndum, þróun og sameiginlegri vinnu við eina eða fleiri greinar.

Á sama tíma er afkastamikið tengslanet á toppráðstefnu erfitt vegna alls skorts á frítíma. Ef vísindamaðurinn hefur haldið styrk sínum eftir heilan dag í kynningum og umræðum á veggspjöldum og hefur þegar sigrast á þotum, þá fer hann í einn af mörgum veislum. Þau eru hýst af fyrirtækjum - þar af leiðandi hafa aðilar oft meira veiðiskap. Á sama tíma nota margir gestir þá alls ekki til að finna nýtt starf, heldur, aftur, fyrir tengslanet. Á kvöldin eru ekki fleiri skýrslur og veggspjöld - það er auðveldara að „ná“ sérfræðinginn sem þú hefur áhuga á.

Verðlaun nefnd eftir Ilya Segalovich. Saga um tölvunarfræði og útgáfurit

Frá hugmynd til framleiðslu

Tölvunarfræði er ein af fáum atvinnugreinum þar sem hagsmunir fyrirtækja og sprotafyrirtækja eru sterklega tengdir hinu fræðilega umhverfi. NIPS, ICML og aðrar svipaðar ráðstefnur laða að fullt af fólki úr iðnaði, ekki bara háskólum. Þetta er dæmigert fyrir sviði tölvunarfræði, en öfugt fyrir flest önnur vísindi.

Á hinn bóginn fara ekki allar hugmyndir sem settar eru fram í greinum strax í að skapa eða bæta þjónustu. Jafnvel innan eins fyrirtækis getur rannsakandi lagt fyrir samstarfsfólk úr þjónustunni hugmynd sem er bylting í vísindalegum mælikvarða og fengið synjun um að hrinda henni í framkvæmd af ýmsum ástæðum. Einn þeirra hefur þegar verið nefndur hér - þetta er munurinn á „fræðilegu“ gagnasettinu sem greinin var skrifuð um og raunverulegu gagnasafninu. Að auki getur innleiðing hugmyndar seinkað, krefst mikils fjármagns eða bætt aðeins einn mælikvarða á kostnað rýrnunar annarra mælikvarða.

Verðlaun nefnd eftir Ilya Segalovich. Saga um tölvunarfræði og útgáfurit

Ástandið er bjargað með því að margir verktaki sjálfir eru svolítið rannsakendur. Þeir sækja ráðstefnur, tala sama tungumál við fræðimenn, koma með hugmyndir, taka stundum þátt í gerð greina (til dæmis skrifa kóða), eða jafnvel starfa sem höfundar sjálfir. Ef verktaki er á kafi í fræðilegu ferli, fylgist með því sem er að gerast í rannsóknadeildinni, í einu orði sagt - ef hann sýnir fram á gagnhreyfingu í garð vísindamanna, þá styttist hringurinn að breyta vísindalegum hugmyndum í nýja þjónustugetu.

Við óskum öllum ungum vísindamönnum góðs gengis og mikils árangurs í starfi. Ef þessi færsla sagði þér ekki neitt nýtt, þá gætir þú hafa þegar birt á toppráðstefnu. Skráðu þig fyrir yfirverði sjálfur og tilnefna vísindalega leiðbeinendur.

Heimild: www.habr.com

Bæta við athugasemd