Prys vernoem na Ilya Segalovich. 'n Storie oor rekenaarwetenskap en bekendstelling van publikasies

Prys vernoem na Ilya Segalovich. 'n Storie oor rekenaarwetenskap en bekendstelling van publikasies

Vandag loods ons 'n wetenskaplike toekenning vernoem na Ilya Segalovich iseg. Dit sal toegeken word vir prestasies op die gebied van rekenaarwetenskap. Voorgraadse en nagraadse studente hul eie aansoek vir die toekenning kan indien of wetenskaplike studieleiers benoem. Die bekroondes sal deur verteenwoordigers van die akademiese gemeenskap en Yandex gekies word. Die belangrikste keuringskriteria: publikasies en aanbiedings by konferensies, asook bydrae tot die ontwikkeling van die gemeenskap.

Die eerste prysuitdeling vind in April plaas. As deel van die toekenning sal jong wetenskaplikes 350 duisend roebels ontvang, en boonop sal hulle na 'n internasionale konferensie kan gaan, saam met 'n mentor kan werk en 'n internskap in die Yandex-navorsingsafdeling kan ondergaan. Wetenskaplike toesighouers sal 700 duisend roebels ontvang.

By geleentheid van die bekendstelling van die toekenning het ons besluit om hier op Habré te gesels oor die kriteria vir sukses in die wêreld van rekenaarwetenskap. Sommige Habr-lesers is reeds vertroud met hierdie kriteria, terwyl ander 'n wanindruk daaroor kan hê. Vandag sal ons hierdie gaping oorbrug - ons sal al die hoofonderwerpe aanraak, insluitend artikels, konferensies, datastelle en die oordrag van wetenskaplike idees na dienste.

Vir wetenskaplikes op die gebied van rekenaarwetenskap is die hoofkriterium vir sukses die publikasie van hul wetenskaplike werk by een van die top internasionale konferensies. Dit is die eerste "kontrolepunt" om die navorser se werk te herken. Byvoorbeeld, op die gebied van masjienleer in die algemeen word die Internasionale Konferensie oor Masjienleer (ICML) en die Konferensie oor Neurale Inligtingverwerkingstelsels (NeurIPS, voorheen NIPS) onderskei. Daar is baie konferensies oor spesifieke areas van ML, soos rekenaarvisie, inligtingherwinning, spraaktegnologie, masjienvertaling, ens.

Hoekom jou idees publiseer

Mense wat ver van rekenaarwetenskap is, het dalk die wanopvatting dat dit beter is om die waardevolste idees geheim te hou en daarna te streef om voordeel te trek uit hul uniekheid. Die werklike situasie in ons veld is egter presies die teenoorgestelde. Die gesag van 'n wetenskaplike word beoordeel deur die belangrikheid van sy werke, deur hoe gereeld sy artikels deur ander wetenskaplikes aangehaal word (aanhalingsindeks). Dit is 'n belangrike kenmerk van sy loopbaan. 'n Navorser beweeg op die professionele leer, en word meer gerespekteer in sy gemeenskap, slegs as hy konsekwent sterk werk produseer wat gepubliseer word, beroemd word en die basis vorm vir die werk van ander wetenskaplikes.

Baie topartikels (dalk die meeste) is die resultaat van samewerking tussen navorsers by verskillende universiteite en maatskappye regoor die wêreld. ’n Belangrike en baie waardevolle oomblik in ’n navorser se loopbaan is wanneer hy die geleentheid kry om op sy eie idees te vind en uit te sif op grond van sy ervaring – maar selfs hierna gaan sy kollegas voort om hom van onskatbare hulp te voorsien. Wetenskaplikes help mekaar om idees te ontwikkel, artikels in samewerking te skryf - en hoe groter die wetenskaplike se bydrae tot die wetenskap, hoe makliker is dit vir hom om eendersdenkende mense te vind.

Laastens is die digtheid en beskikbaarheid van inligting nou so groot dat verskillende navorsers gelyktydig met baie soortgelyke (en werklik waardevolle) wetenskaplike idees vorendag kom. As jy nie jou idee publiseer nie, sal iemand anders dit byna seker vir jou publiseer. Die "wenner" is dikwels nie die een wat 'n bietjie vroeër met die innovasie vorendag gekom het nie, maar die een wat dit 'n bietjie vroeër gepubliseer het. Of - die een wat daarin geslaag het om die idee so volledig, duidelik en oortuigend moontlik te openbaar.

Prys vernoem na Ilya Segalovich. 'n Storie oor rekenaarwetenskap en bekendstelling van publikasies

Artikels en datastelle

Dus, 'n wetenskaplike artikel is gebou rondom die hoofgedagte wat die navorser voorstel. Hierdie idee is sy bydrae tot rekenaarwetenskap. Die artikel begin met 'n beskrywing van die idee, geformuleer in 'n paar sinne. Dit word gevolg deur 'n inleiding wat die reeks probleme beskryf wat opgelos is met behulp van die voorgestelde innovasie. Die beskrywing en inleiding word gewoonlik in eenvoudige taal geskryf wat vir 'n wye gehoor verstaanbaar is. Na die inleiding is dit nodig om die probleme wat in wiskundige taal aangebied word te formaliseer en streng notasie in te voer. Dan, met behulp van die ingevoerde notasies, moet jy 'n duidelike en omvattende verklaring van die essensie van die voorgestelde innovasie skep, en die verskille van vorige, soortgelyke metodes identifiseer. Alle teoretiese stellings moet óf ondersteun word deur verwysings na voorheen saamgestelde bewyse, óf onafhanklik bewys word. Dit kan met sekere aannames gedoen word. Byvoorbeeld, jy kan 'n bewys gee vir die geval wanneer daar 'n oneindige hoeveelheid opleidingsdata is ('n ooglopend onbereikbare situasie) of hulle is heeltemal onafhanklik van mekaar. Teen die einde van die artikel praat die wetenskaplike oor die eksperimentele resultate wat hy kon verkry.

Prys vernoem na Ilya Segalovich. 'n Storie oor rekenaarwetenskap en bekendstelling van publikasies

Om die beoordelaars wat deur die konferensie-organiseerders gewerf is meer geneig is om 'n referaat goed te keur, moet dit een of meer eienskappe hê. ’n Sleutelfaktor wat die kanse op goedkeuring verhoog, is die wetenskaplike nuutheid van die voorgestelde idee. Dikwels word nuutheid beoordeel in verhouding tot reeds bestaande idees - en die werk om dit te assesseer word nie deur die resensent uitgevoer nie, maar deur die skrywer van die artikel self. Ideaal gesproke moet die skrywer in die artikel breedvoerig vertel van bestaande metodes en, indien moontlik, dit as spesiale gevalle van sy metode aanbied. Die wetenskaplike toon dus aan dat die aanvaarde benaderings nie altyd werk nie, dat hy dit veralgemeen het en 'n breër, meer buigsame en dus meer effektiewe teoretiese formulering voorgestel het. As die nuwigheid onmiskenbaar is, evalueer resensente anders die artikel nie so kieskeurig nie - hulle kan byvoorbeeld 'n blinde oog draai vir swak Engels.

Om nuwigheid te versterk, is dit nuttig om 'n vergelyking met bestaande metodes op een of meer datastelle in te sluit. Elkeen van hulle moet oop en aanvaar word in die akademiese omgewing. Daar is byvoorbeeld die ImageNet-beeldbewaarplek en databasisse van institute soos die Modified National Institute of Standards and Technology (MNIST) en CIFAR (Canadian Institute For Advanced Research). Die moeilikheid is dat so 'n "akademiese" datastel dikwels in inhoudstruktuur verskil van die werklike data waarmee die bedryf te doen het. Verskillende data beteken verskillende resultate van die voorgestelde metode. Wetenskaplikes wat deels vir die bedryf werk, probeer dit in ag neem en voeg soms klousules in soos "op ons data is die resultaat so en so, maar op die publieke datastel - so en so."

Dit gebeur dat die voorgestelde metode heeltemal "aangepas" is vir 'n oop databasis en nie op werklike data werk nie. Jy kan hierdie algemene probleem bekamp deur nuwe, meer verteenwoordigende datastelle oop te maak, maar dikwels praat ons van private inhoud wat maatskappye eenvoudig nie die reg het om oop te maak nie. In sommige gevalle voer hulle (soms komplekse en noukeurige) anonimisering van data uit - hulle verwyder enige fragmente wat na 'n spesifieke persoon wys. Gesigte en nommers in foto's word byvoorbeeld uitgevee of onleesbaar gemaak. Daarbenewens, sodat die datastel nie net vir almal beskikbaar moet wees nie, maar om 'n standaard onder wetenskaplikes te word waarop dit gerieflik is om idees te vergelyk, is dit nodig om dit nie net te publiseer nie, maar ook om 'n afsonderlike aangehaalde artikel te skryf oor dit en sy voordele.

Dit is erger as daar geen oop datastelle is in die onderwerp wat bestudeer word nie. Dan kan die resensent slegs die resultate wat die skrywer oor geloof aanbied, aanvaar. Teoreties kan die skrywer hulle selfs oorskat en onopgemerk bly, maar in 'n akademiese omgewing is dit onwaarskynlik, aangesien dit in stryd is met die begeerte van die oorgrote meerderheid wetenskaplikes om wetenskap te ontwikkel.

In 'n aantal areas van ML, insluitend rekenaarvisie, is dit ook algemeen om skakels aan kode (gewoonlik aan GitHub) met artikels te heg. Die artikels self bevat óf baie min kode óf is pseudokode. En hier ontstaan ​​weereens probleme as die artikel deur 'n navorser van 'n maatskappy geskryf word, en nie van 'n universiteit nie. By verstek word kode wat in 'n korporasie of opstart geskryf is, gemerk NDA. Navorsers en hul kollegas moet hard werk om die kode wat verband hou met die idee wat beskryf word van interne en beslis geslote bewaarplekke te skei.

Die kans op publikasie hang ook af van die relevansie van die gekose onderwerp. Relevansie word grootliks bepaal deur produkte en dienste: as 'n korporasie of beginonderneming belangstel om 'n nuwe diens te bou of 'n bestaande een te verbeter gebaseer op 'n idee uit 'n artikel, is dit 'n pluspunt.

Prys vernoem na Ilya Segalovich. 'n Storie oor rekenaarwetenskap en bekendstelling van publikasies

Soos reeds genoem, word rekenaarwetenskapvraestelle selde alleen geskryf. Maar as 'n reël bestee een van die skrywers baie meer tyd en moeite as die ander. Sy bydrae tot wetenskaplike nuutheid is die grootste. In die lys van skrywers word so 'n persoon eerste aangedui - en in die toekoms, wanneer na 'n artikel verwys word, kan hulle hom net noem (byvoorbeeld "Ivanov et al" - "Ivanov en ander" uit Latyn vertaal). Ander se bydraes is egter ook uiters waardevol – anders is dit onmoontlik om op die lys van skrywers te wees.

Hersien proses

Referate word gewoonlik etlike maande voor die konferensie nie meer aanvaar nie. Nadat 'n artikel ingedien is, het resensente 3–5 weke om dit te lees, te evalueer en daarop kommentaar te lewer. Dit gebeur volgens die enkelblindingsisteem, wanneer die outeurs nie die name van die resensente sien nie, of die dubbelblindings, wanneer die resensente self nie die name van die outeurs sien nie. Die tweede opsie word as meer onpartydig beskou: verskeie wetenskaplike referate het getoon dat die skrywer se gewildheid die resensent se besluit beïnvloed. Hy kan byvoorbeeld van mening wees dat 'n wetenskaplike met 'n groot aantal reeds gepubliseerde artikels a priori 'n hoër gradering waardig is.

Bowendien, selfs in die geval van dubbelblind, sal die resensent waarskynlik die skrywer raai as hulle in dieselfde veld werk. Daarbenewens, ten tyde van hersiening, kan die artikel reeds gepubliseer word in die arXiv databasis, die grootste bewaarplek van wetenskaplike referate. Konferensie-organiseerders verbied dit nie, maar hulle beveel aan om 'n ander titel en 'n ander opsomming in publikasies vir arXiv te gebruik. Maar as die artikel daar geplaas is, sal dit steeds nie moeilik wees om dit te vind nie.

Daar is altyd verskeie beoordelaars wat 'n artikel evalueer. Een van hulle kry die rol van meta-beoordelaar, wat slegs die uitsprake van sy kollegas moet hersien en die finale besluit moet neem. As die beoordelaars nie saamstem oor die artikel nie, kan die meta-beoordelaar dit ook vir volledigheid lees.

Soms het die skrywer, na die beoordeling en kommentaar, die geleentheid om met die resensent in gesprek te tree; daar is selfs 'n kans om hom te oortuig om sy besluit te verander (so 'n stelsel werk egter nie vir alle konferensies nie, en dit is nog minder moontlik om die uitspraak ernstig te beïnvloed). In die bespreking kan jy nie na ander wetenskaplike werke verwys nie, met die uitsondering van dié waarna reeds in die artikel verwys is. Jy kan die resensent net “help” om die inhoud van die artikel beter te verstaan.

Prys vernoem na Ilya Segalovich. 'n Storie oor rekenaarwetenskap en bekendstelling van publikasies

Konferensies en joernale

Rekenaarwetenskap-artikels word meer dikwels aan konferensies voorgelê as aan wetenskaplike tydskrifte. Dit is omdat tydskrifpublikasies vereistes het wat moeiliker is om te voldoen, en die portuurbeoordelingsproses kan maande of selfs jare neem. Rekenaarwetenskap is 'n baie vinnig bewegende veld, so skrywers is gewoonlik nie bereid om so lank vir publikasie te wag nie. ’n Artikel wat egter reeds vir die konferensie aanvaar is, kan dan aangevul word (byvoorbeeld deur meer gedetailleerde resultate aan te bied) en gepubliseer word in ’n joernaal waar spasiebeperkings nie so streng is nie.

Gebeure by die konferensie

Die formaat vir die teenwoordigheid van outeurs van goedgekeurde artikels by die konferensie word deur die beoordelaars bepaal. As die artikel die groen lig kry, word u meestal 'n plakkaatstaander toegeken. 'n Plakkaat is 'n statiese skyfie met 'n opsomming van die artikel en illustrasies. Sommige konferensielokale is gevul met lang rye plakkaatstaanders. Die skrywer spandeer 'n aansienlike deel van sy tyd naby sy plakkaat en kommunikeer met wetenskaplikes wat in die artikel belangstel.

Prys vernoem na Ilya Segalovich. 'n Storie oor rekenaarwetenskap en bekendstelling van publikasies

Prys vernoem na Ilya Segalovich. 'n Storie oor rekenaarwetenskap en bekendstelling van publikasies

’n Effens meer gesogte opsie vir deelname is ’n weerligpraatjie. As die beoordelaars die artikel waardig ag om 'n vinnige verslag te doen, kry die skrywer ongeveer drie minute om met 'n wye gehoor te praat. Aan die een kant is 'n weerligpraatjie 'n goeie geleentheid om oor jou idee te vertel nie net aan diegene wat op eie inisiatief in die plakkaat belang gestel het nie. Aan die ander kant is proaktiewe plakkaatbesoekers meer voorbereid en meer verdiep in jou spesifieke onderwerp as die gemiddelde luisteraar in die saal. Daarom moet jy in 'n vinnige verslag nog tyd hê om mense op hoogte te bring.

Prys vernoem na Ilya Segalovich. 'n Storie oor rekenaarwetenskap en bekendstelling van publikasies

Gewoonlik, aan die einde van hul weerligpraatjie, noem skrywers die plakkaatnommer sodat luisteraars dit kan vind en die artikel beter kan verstaan.

Prys vernoem na Ilya Segalovich. 'n Storie oor rekenaarwetenskap en bekendstelling van publikasies

Die laaste, mees gesogte opsie is 'n plakkaat plus 'n volwaardige aanbieding van die idee, wanneer dit nie meer nodig is om te haas om die storie te vertel nie.

Prys vernoem na Ilya Segalovich. 'n Storie oor rekenaarwetenskap en bekendstelling van publikasies

Maar natuurlik kom wetenskaplikes – insluitend die skrywers van goedgekeurde artikels – na die volgende konferensie nie net om te pronk nie. Eerstens is hulle geneig om plakkate te vind wat verband hou met hul veld om ooglopende redes. En tweedens is dit vir hulle belangrik om hul lys van kontakte uit te brei vir die doel van gesamentlike akademiese werk in die toekoms. Dit is nie jag nie - of ten minste sy heel eerste stadium, wat ten minste gevolg word deur 'n wedersyds voordelige uitruil van idees, ontwikkelings en gesamentlike werk aan een of meer artikels.

Terselfdertyd is produktiewe netwerkvorming by 'n topkonferensie moeilik weens die totale gebrek aan vrye tyd. As die wetenskaplike, na 'n hele dag by aanbiedings en in besprekings by plakkate, sy krag behou het en reeds 'n jetlag oorkom het, dan gaan hy na een van die vele partytjies. Hulle word deur korporasies aangebied - gevolglik het die partye dikwels 'n meer jagterige karakter. Terselfdertyd gebruik baie gaste dit glad nie om 'n nuwe werk te kry nie, maar weer vir netwerke. Saans is daar nie meer verslae en plakkate nie - dit is makliker om die spesialis waarin jy belangstel te "vang".

Prys vernoem na Ilya Segalovich. 'n Storie oor rekenaarwetenskap en bekendstelling van publikasies

Van idee tot produksie

Rekenaarwetenskap is een van die min bedrywe waar die belange van korporasies en beginners sterk aan die akademiese omgewing gekoppel is. NIPS, ICML en ander soortgelyke konferensies lok baie mense uit die industrie, nie net universiteite nie. Dit is tipies vir die veld van rekenaarwetenskap, maar omgekeerd vir die meeste ander wetenskappe.

Aan die ander kant, nie alle idees wat in artikels aangebied word, gaan onmiddellik na die skep of verbetering van dienste nie. Selfs binne een maatskappy kan 'n navorser aan kollegas van die diens 'n idee voorstel wat volgens wetenskaplike standaarde deurbraak is en om 'n aantal redes weiering ontvang om dit te implementeer. Een daarvan is reeds hier genoem – dit is die verskil tussen die “akademiese” datastel waarop die artikel geskryf is en die werklike datastel. Daarbenewens kan die implementering van 'n idee vertraag word, 'n groot hoeveelheid hulpbronne benodig, of slegs een aanwyser verbeter ten koste van verswakkende ander maatstawwe.

Prys vernoem na Ilya Segalovich. 'n Storie oor rekenaarwetenskap en bekendstelling van publikasies

Die situasie word gered deur die feit dat baie ontwikkelaars self 'n bietjie navorsers is. Hulle woon konferensies by, praat dieselfde taal met akademici, stel idees voor, neem soms deel aan die skep van artikels (byvoorbeeld om kode te skryf), of tree selfs self as skrywers op. As 'n ontwikkelaar gedompel is in die akademiese proses, volg wat in die navorsingsdepartement gebeur, in 'n woord - as hy 'n teenbeweging teenoor wetenskaplikes demonstreer, dan word die siklus om wetenskaplike idees in nuwe diensvermoëns te omskep, verkort.

Ons wens alle jong navorsers sterkte en groot prestasies in hul werk toe. As hierdie pos jou niks nuuts vertel het nie, het jy dalk reeds by 'n topkonferensie gepubliseer. Registreer vir premie jouself en benoem wetenskaplike studieleiers.

Bron: will.com

Voeg 'n opmerking