Priis neamd nei Ilya Segalovich. In ferhaal oer kompjûterwittenskip en lansearring fan publikaasjes

Priis neamd nei Ilya Segalovich. In ferhaal oer kompjûterwittenskip en lansearring fan publikaasjes

Hjoed lansearje wy in wittenskiplike priis neamd nei Ilya Segalovich iseg. It sil wurde útrikt foar prestaasjes op it mêd fan kompjûterwittenskip. Undergraduate en postgraduate studinten kinne har eigen oanfraach foar de priis yntsjinje of nominearje wittenskiplike tafersjochhâlders. De laureaten sille wurde keazen troch fertsjintwurdigers fan 'e akademyske mienskip en Yandex. De wichtichste seleksjekritearia: publikaasjes en presintaasjes op konferinsjes, lykas bydrage oan 'e ûntwikkeling fan' e mienskip.

De earste priisútrikking fynt plak yn april. As ûnderdiel fan 'e priis krije jonge wittenskippers 350 tûzen roebel, en dêrneist kinne se nei in ynternasjonale konferinsje gean, wurkje mei in mentor en in staazje ûndergean yn' e Yandex-ûndersykôfdieling. Wittenskiplike tafersjochhâlders krije 700 tûzen roebel.

Ta gelegenheid fan de útrikking fan de priis hawwe wy besletten om hjir op Habré te praten oer de kritearia foar sukses yn de wrâld fan de kompjûterwittenskip. Guon Habr-lêzers binne al bekend mei dizze kritearia, wylst oaren der miskien in falske yndruk oer hawwe. Hjoed sille wy dizze gat oerbrêgje - wy sille alle haadûnderwerpen oanreitsje, ynklusyf artikels, konferinsjes, datasets en de oerdracht fan wittenskiplike ideeën yn tsjinsten.

Foar wittenskippers op it mêd fan kompjûterwittenskip is it wichtichste kritearium foar sukses de publikaasje fan har wittenskiplik wurk op ien fan 'e top ynternasjonale konferinsjes. Dit is it earste "kontrôlepunt" foar it erkennen fan it wurk fan 'e ûndersiker. Bygelyks, op it mêd fan masine learen yn 't algemien, wurde de International Conference on Machine Learning (ICML) en de Conference on Neural Information Processing Systems (NeurIPS, eartiids NIPS) ûnderskieden. D'r binne in protte konferinsjes oer spesifike gebieten fan ML, lykas kompjûterfisy, opheljen fan ynformaasje, spraaktechnology, masine-oersetting, ensfh.

Wêrom publisearje jo ideeën

Minsken dy't fier fan kompjûterwittenskip binne, kinne de misfetting hawwe dat it better is om de meast weardefolle ideeën geheim te hâlden en te besykjen om te profitearjen fan har eigenheid. De echte situaasje yn ús fjild is lykwols krekt oarsom. It gesach fan in wittenskipper wurdt beoardiele troch de betsjutting fan syn wurken, troch hoe faak syn artikels troch oare wittenskippers oanhelle wurde (sitaasje-yndeks). Dit is in wichtich skaaimerk fan syn karriêre. In ûndersiker beweecht de profesjonele ljedder op, wurdt mear respektearre yn syn mienskip, allinich as hy konsekwint sterk wurk makket dat publisearre wurdt, ferneamd wurdt en de basis foarmet foar it wurk fan oare wittenskippers.

In protte topartikels (miskien de measte) binne it resultaat fan gearwurking tusken ûndersikers oan ferskate universiteiten en bedriuwen oer de hiele wrâld. In wichtich en tige weardefol momint yn de karriêre fan in ûndersiker is as er de kâns krijt om op basis fan syn ûnderfining sels ideeën te finen en út te sieden - mar ek dêrnei bliuwe syn kollega's him ûnskatbere help jaan. Wittenskippers helpe elkoar ideeën te ûntwikkeljen, artikels skriuwe yn gearwurking - en hoe grutter de bydrage fan 'e wittenskipper oan 'e wittenskip, hoe makliker it is foar him om likesinnige minsken te finen.

Uteinlik is de tichtens en beskikberens fan ynformaasje no sa grut dat ferskate ûndersikers tagelyk mei hiel ferlykbere (en wier weardefolle) wittenskiplike ideeën komme. As jo ​​​​jo idee net publisearje, sil in oar it hast wis foar jo publisearje. De "winner" is faak net dejinge dy't wat earder mei de ynnovaasje kaam, mar dejinge dy't it wat earder publisearre. Of - dejinge dy't it idee sa folslein, dúdlik en oertsjûgjend mooglik ûntdekke koe.

Priis neamd nei Ilya Segalovich. In ferhaal oer kompjûterwittenskip en lansearring fan publikaasjes

Artikels en datasets

Dat, in wittenskiplik artikel is boud om it haadidee dat de ûndersiker foarstelt. Dit idee is syn bydrage oan kompjûterwittenskip. It artikel begjint mei in beskriuwing fan it idee, formulearre yn in pear sinnen. Dit wurdt folge troch in ynlieding dy't beskriuwt it oanbod fan problemen oplost mei help fan de foarstelde ynnovaasje. De beskriuwing en ynlieding binne meastentiids skreaun yn ienfâldige taal dy't begryplik is foar in breed publyk. Nei de ynlieding is it nedich om de problemen presintearre yn wiskundige taal te formalisearjen en strikte notaasje yn te fieren. Dan, mei de ynfierde notaasjes, moatte jo in dúdlike en wiidweidige ferklearring meitsje fan 'e essinsje fan' e foarstelde ynnovaasje, en de ferskillen fan eardere, ferlykbere metoaden identifisearje. Alle teoretyske útspraken moatte wurde stipe troch ferwizings nei earder gearstald bewiis, of selsstannich bewiisd. Dit kin dien wurde mei guon oannames. Jo kinne bygelyks in bewiis jaan foar it gefal as der in ûneinich oantal trainingsgegevens is (in fansels net te berikken situaasje) of se binne folslein ûnôfhinklik fan elkoar. Tsjin it ein fan it artikel fertelt de wittenskipper oer de eksperimintele resultaten dy't er helje koe.

Priis neamd nei Ilya Segalovich. In ferhaal oer kompjûterwittenskip en lansearring fan publikaasjes

Om de beoardielers rekrutearre troch de organisatoaren fan 'e konferinsje wierskynliker in papier goed te keuren, moat it ien of mear attributen hawwe. In wichtige faktor dy't de kâns op goedkarring fergruttet is de wittenskiplike nijichheid fan it foarstelde idee. Faak wurdt nijichheid beoardiele yn relaasje ta al besteande ideeën - en it wurk fan it beoardieljen wurdt net útfierd troch de resinsint, mar troch de skriuwer fan it artikel sels. Ideal, de skriuwer moat fertelle yn detail yn it artikel oer besteande metoaden en, as it mooglik is, presintearje se as spesjale gefallen fan syn metoade. Sa lit de wittenskipper sjen dat de akseptearre oanpakken net altyd wurkje, dat hy se generalisearre en in bredere, fleksibeler en dus effektiver teoretyske formulearring foarstelde. As de nijichheid net te bestriden is, dan beoardielje beoordelaars it artikel oars net sa kieskeurich - se kinne bygelyks in blyn each meitsje foar min Ingelsk.

Om nij te fersterkjen, is it nuttich om in ferliking mei besteande metoaden op ien of mear datasetten op te nimmen. Elk fan har moat iepen en aksepteare wêze yn 'e akademyske omjouwing. Bygelyks, d'r is it ImageNet-ôfbyldingsrepository en databases fan sokke ynstituten as it Modified National Institute of Standards and Technology (MNIST) en CIFAR (Canadian Institute For Advanced Research). De swierrichheid is dat sa'n "akademyske" dataset faaks yn ynhâldstruktuer ferskilt fan 'e echte gegevens wêrmei't de yndustry omgiet. Ferskillende gegevens betsjutte ferskillende resultaten fan 'e foarstelde metoade. Wittenskippers dy't foar in part wurkje foar de yndustry besykje dit yn rekken te hâlden en foegje soms disclaimers yn lykas "op ús gegevens is it resultaat sa en sa, mar op de publike dataset - sa en sa."

It bart dat de foarstelde metoade folslein "op maat" is nei in iepen databank en wurket net op echte gegevens. Jo kinne dit mienskiplike probleem bestride troch nije, mear represintative datasets te iepenjen, mar faak hawwe wy it oer privee ynhâld dy't bedriuwen gewoan net it rjocht hawwe om te iepenjen. Yn guon gefallen, se fiere (soms komplekse en pynlike) anonymization fan gegevens - se fuortsmite alle fragminten dy't wize op in spesifike persoan. Gesichten en sifers op foto's wurde bygelyks wiske of ûnlêsber makke. Derneist, om de dataset net allinich foar elkenien beskikber te wêzen, mar in standert te wurden ûnder wittenskippers dêr't it handich is om ideeën te fergelykjen, is it net allinich nedich om it te publisearjen, mar ek in apart oanhelle artikel te skriuwen oer it en syn foardielen.

It is slimmer as d'r gjin iepen datasets binne yn it ûnderwerp dat wurdt bestudearre. Dan kin de resinsint allinich de resultaten akseptearje dy't troch de auteur op leauwen presintearre wurde. Teoretysk koe de skriuwer har sels oerskatte en ûnopspoard bliuwe, mar yn in akademyske omjouwing is dit net wierskynlik, om't it yn striid is mei de winsk fan 'e grutte mearderheid fan wittenskippers om wittenskip te ûntwikkeljen.

Yn in oantal gebieten fan ML, ynklusyf kompjûterfisy, is it ek gewoan om keppelings te heakjen oan koade (meastentiids nei GitHub) mei artikels. De artikels sels befetsje óf in bytsje koade óf binne pseudokoade. En hjir ûntsteane wer swierrichheden as it artikel skreaun is troch in ûndersiker fan in bedriuw, en net fan in universiteit. Standert wurdt koade skreaun yn in korporaasje as opstarten markearre NDA. Undersikers en har kollega's moatte hurd wurkje om de koade yn ferbân mei it beskreaune idee te skieden fan ynterne en wis sletten repositories.

De kâns op publikaasje hinget ek ôf fan de relevânsje fan it keazen ûnderwerp. Relevânsje wurdt foar in grut part diktearre troch produkten en tsjinsten: as in korporaasje of opstart is ynteressearre yn it bouwen fan in nije tsjinst of it ferbetterjen fan in besteande op basis fan in idee út in artikel, dat is in plus.

Priis neamd nei Ilya Segalovich. In ferhaal oer kompjûterwittenskip en lansearring fan publikaasjes

Lykas al neamd, wurde komputerwittenskippen komselden allinich skreaun. Mar as regel, ien fan de skriuwers besteget folle mear tiid en muoite as de oaren. Syn bydrage oan wittenskiplike nijichheid is de grutste. Yn 'e list fan auteurs wurdt sa'n persoan earst oanjûn - en yn' e takomst, as jo ferwize nei in artikel, kinne se him allinich neame (bygelyks "Ivanov et al" - "Ivanov en oaren" oerset út it Latyn). De bydragen fan oaren binne lykwols ek tige weardefol - oars is it net mooglik om op 'e auteurslist te kommen.

Review proses

Papieren stopje normaal inkele moannen foar de konferinsje te akseptearjen. Nei't in artikel is yntsjinne, hawwe resinsinten 3-5 wiken om it te lêzen, evaluearje en kommentaar te jaan. Dat bart neffens it ienblinde systeem, as de skriuwers de nammen fan de resinsinten net sjogge, of de dûbelblinden, as de resinsinten sels de nammen fan de auteurs net sjogge. De twadde opsje wurdt beskôge as ûnpartidicher: ferskate wittenskiplike papers hawwe oantoand dat de populariteit fan de skriuwer beynfloedet it beslút fan de resinsint. Hy kin bygelyks tinke dat in wittenskipper mei in grut tal al publisearre artikels a priori in hegere wurdearring wurdich is.

Boppedat sil de resinsint ek by dûbelblin de skriuwer wierskynlik riede as se op itselde mêd wurkje. Derneist, op it momint fan beoardieling, kin it artikel al publisearre wurde yn 'e arXiv-database, it grutste repository fan wittenskiplike papers. Organisatoaren fan konferinsjes ferbiede dit net, mar se riede oan om in oare titel en in oare abstrakt te brûken yn publikaasjes foar arXiv. Mar as it artikel dêr pleatst is, sil it noch net dreech wêze om it te finen.

D'r binne altyd ferskate resinsinten dy't in artikel evaluearje. Ien fan harren wurdt tawiisd de rol fan meta-reviewer, dy't moat allinne besjen de útspraken fan syn kollega en meitsje it definitive beslút. As de resinsinten it net iens binne oer it artikel, kin de meta-resinsint it ek foar folsleinens lêze.

Soms hat de skriuwer, nei it beoardieljen fan de wurdearring en opmerkings, de kâns om mei de resinsint yn diskusje te gean; der is sels in kâns om him te oertsjûgjen om syn beslút te feroarjen (sa'n systeem wurket lykwols net foar alle konferinsjes, en it is noch minder mooglik om de útspraak serieus te beynfloedzjen). Yn 'e diskusje kinne jo net ferwize nei oare wittenskiplike wurken, mei útsûndering fan dyjingen dy't al ferwize yn it artikel. Jo kinne de resinsint allinich "helpe" om de ynhâld fan it artikel better te begripen.

Priis neamd nei Ilya Segalovich. In ferhaal oer kompjûterwittenskip en lansearring fan publikaasjes

Konferinsjes en tydskriften

Kompjûterwittenskiplike artikels wurde faker yntsjinne by konferinsjes as oan wittenskiplike tydskriften. Dit komt om't tydskriftpublikaasjes easken hawwe dy't dreger binne om te foldwaan, en it proses fan peer review kin moannen of sels jierren duorje. Kompjûterwittenskip is in heul rap bewegend fjild, dus auteurs binne meastentiids net ree om sa lang te wachtsjen op publikaasje. Lykwols, in artikel dat al akseptearre is foar de konferinsje kin dan oanfolle wurde (bygelyks troch it presintearjen fan mear detaillearre resultaten) en publisearre wurde yn in tydskrift dêr't romte beheinings binne net sa strang.

Eveneminten op de konferinsje

It formaat foar de oanwêzigens fan auteurs fan goedkarde artikels op 'e konferinsje wurdt bepaald troch de resinsinten. As it artikel grien ljocht kriget, dan krije jo meast in posterstand. In poster is in statyske dia mei in gearfetting fan it artikel en yllustraasjes. Guon konferinsjeromten binne fol mei lange rigen postertribunes. De skriuwer besteget in wichtich part fan syn tiid tichtby syn poster, kommunisearje mei wittenskippers dy't ynteressearre binne yn it artikel.

Priis neamd nei Ilya Segalovich. In ferhaal oer kompjûterwittenskip en lansearring fan publikaasjes

Priis neamd nei Ilya Segalovich. In ferhaal oer kompjûterwittenskip en lansearring fan publikaasjes

In wat mear prestizjeuze opsje foar dielname is in bliksempraat. As de resinsinten it artikel in rap rapport wurdich fine, krijt de skriuwer sa'n trije minuten om mei in breed publyk te praten. Oan 'e iene kant is in bliksempraat in goede gelegenheid om te fertellen oer jo idee net allinich oan dyjingen dy't op eigen inisjatyf ynteressearre binne yn 'e poster. Oan 'e oare kant binne proaktive posterbesikers mear taret en mear ûnderdompele yn jo spesifike ûnderwerp as de gemiddelde harker yn' e seal. Dêrom moatte jo yn in rappe rapportaazje noch tiid hawwe om minsken op 'e hichte te bringen.

Priis neamd nei Ilya Segalovich. In ferhaal oer kompjûterwittenskip en lansearring fan publikaasjes

Gewoanlik, oan 'e ein fan har bliksempraat, neame auteurs it posternûmer, sadat harkers it kinne fine en it artikel better begripe.

Priis neamd nei Ilya Segalovich. In ferhaal oer kompjûterwittenskip en lansearring fan publikaasjes

De lêste, meast prestizjeuze opsje is in poster plus in folsleine presintaasje fan it idee, as it net mear hoecht te haasten om it ferhaal te fertellen.

Priis neamd nei Ilya Segalovich. In ferhaal oer kompjûterwittenskip en lansearring fan publikaasjes

Mar fansels komme wittenskippers - ynklusyf de auteurs fan goedkarde artikels - nei de folgjende konferinsje net allinich om te pronkjen. Earst hawwe se de neiging om posters te finen dy't relatearre binne oan har fjild om foar de hân lizzende redenen. En yn it twadde plak is it foar harren wichtich om harren kontaktlist út te wreidzjen foar it doel fan mienskiplik akademysk wurk yn de takomst. Dit is gjin jacht - of, alteast, de alderearste etappe, dy't op syn minst folge wurdt troch in foar elkoar foardielige útwikseling fan ideeën, ûntwikkelingen en mienskiplik wurk oan ien of mear artikels.

Tagelyk is produktyf netwurkjen op in topkonferinsje lestich fanwege it totale gebrek oan frije tiid. As de wittenskipper, nei in hiele dei oan presintaasjes en yn diskusjes by posters, syn krêft behâlden hat en de jetlag al oerwûn hat, dan giet er nei ien fan de protte partijen. Se wurde hosted troch korporaasjes - dêrtroch hawwe de partijen faak in mear jagerich karakter. Tagelyk brûke in protte gasten se hielendal net om in nije baan te finen, mar, wer, foar netwurken. Jûns binne d'r gjin rapporten en posters mear - it is makliker om de spesjalist te "fangen" wêryn jo ynteressearre binne.

Priis neamd nei Ilya Segalovich. In ferhaal oer kompjûterwittenskip en lansearring fan publikaasjes

Fan idee oant produksje

Kompjûterwittenskip is ien fan 'e pear yndustry wêr't de belangen fan bedriuwen en startups sterk keppele binne oan 'e akademyske omjouwing. NIPS, ICML en oare ferlykbere konferinsjes lûke in protte minsken út 'e yndustry, net allinich universiteiten. Dit is typysk foar it mêd fan kompjûterwittenskip, mar oarsom foar de measte oare wittenskippen.

Oan 'e oare kant geane net alle ideeën presintearre yn artikels fuortendaliks nei it meitsjen of ferbetterjen fan tsjinsten. Sels binnen ien bedriuw kin in ûndersiker oan kollega's fan 'e tsjinst in idee foarstelle dat troch wittenskiplike noarmen is trochbraak en om in oantal redenen in wegering krije om it út te fieren. Ien fan har is hjir al neamd - dit is it ferskil tusken de "akademyske" gegevensset wêrop it artikel is skreaun en de echte gegevensset. Derneist kin de ymplemintaasje fan in idee fertrage wurde, in grutte hoemannichte boarnen fereaskje, of mar ien yndikator ferbetterje op kosten fan fersmoarging fan oare metriken.

Priis neamd nei Ilya Segalovich. In ferhaal oer kompjûterwittenskip en lansearring fan publikaasjes

De situaasje wurdt bewarre troch it feit dat in protte ûntwikkelders sels in bytsje ûndersikers binne. Se besykje konferinsjes, prate deselde taal mei akademisy, stelle ideeën foar, dogge soms mei oan it meitsjen fan artikels (bygelyks koade skriuwe), of sels fungearje as auteurs. As in ûntwikkelder is ûnderdompele yn it akademyske proses, folget wat der bart yn 'e ûndersyk ôfdieling, yn in wurd - as hy toant in tsjinbeweging nei wittenskippers, dan wurdt de syklus fan it omsette fan wittenskiplike ideeën yn nije tsjinst mooglikheden ynkoarte.

Wy winskje alle jonge ûndersikers lok en grutte prestaasjes ta yn harren wurk. As dizze post jo neat nijs fertelde, dan hawwe jo miskien al publisearre op in topkonferinsje. Registrearje foar premium dysels en nominearje wittenskiplike tafersjochhâlders.

Boarne: www.habr.com

Add a comment