Ilya Segalovich-en izena duen saria. Informatikari buruzko istorio bat eta kaleratzeko argitalpenak

Ilya Segalovich-en izena duen saria. Informatikari buruzko istorio bat eta kaleratzeko argitalpenak

Gaur Ilya Segalovich izena duen sari zientifiko bat kaleratzen dugu iseg. Informatika arloko lorpenengatik emango da. Gradu eta graduondoko ikasleak sarirako bere eskaera aurkez dezakete edo arduradun zientifikoak izendatzea. Saridunak komunitate akademikoko eta Yandexeko ordezkariek aukeratuko dituzte. Hautaketa-irizpide nagusiak: argitalpenak eta hitzaldietan egindako aurkezpenak, baita komunitatearen garapenerako ekarpena ere.

Lehen sari banaketa apirilean izango da. Sariaren baitan, zientzialari gazteek 350 mila errublo jasoko dituzte eta, gainera, nazioarteko konferentzia batera joan, tutore batekin lan egin eta Yandex ikerketa sailean praktikak egin ahal izango dituzte. Arduradun zientifikoek 700 mila errublo jasoko dituzte.

Saria martxan jartzearen harira, hemen HabrΓ©-n hitz egitea erabaki dugu informatika munduan arrakasta izateko irizpideei buruz. Habr-eko irakurle batzuek dagoeneko ezagutzen dituzte irizpide horiek, eta beste batzuek inpresio faltsua izan dezakete. Gaur hutsune hori konponduko dugu: gai nagusi guztiak ukituko ditugu, besteak beste, artikuluak, hitzaldiak, datu multzoak eta ideia zientifikoak zerbitzuetara transferitzea.

Informatika arloko zientzialarientzat, arrakasta izateko irizpide nagusia nazioarteko kongresu garrantzitsuenetako batean euren lan zientifikoak argitaratzea da. Hau da ikertzailearen lana aitortzeko lehen "kontrol-puntua". Esaterako, ikaskuntza automatikoaren alorrean, oro har, International Conference on Machine Learning (ICML) eta Conference on Neural Information Processing Systems (NeurIPS, lehenago NIPS) bereizten dira. Jardunaldi ugari egiten dira MLaren arlo zehatzei buruz, hala nola, ordenagailu bidezko ikusmenari, informazioaren berreskurapenari, hizketa-teknologiari, itzulpen automatikoari, etab.

Zergatik argitaratu zure ideiak

Informatikatik urrun dauden pertsonek ideiarik baliotsuenak isilpean gordetzea eta haien berezitasunari etekina ateratzen ahalegintzea hobe dela uste okerra izan dezakete. Hala ere, gure esparruko benetako egoera guztiz kontrakoa da. Zientzialari baten autoritatea bere lanen garrantziaren arabera epaitzen da, bere artikuluak beste zientzialariek zenbateko maiztasunarekin aipatzen dituzten (aipuen indizea). Hau da bere ibilbidearen ezaugarri garrantzitsu bat. Ikertzaile batek eskailera profesionalean gora egiten du, bere komunitatean errespetatuago bihurtuz, argitaratzen den, ospetsu bihurtzen eta beste zientzialari batzuen lanaren oinarria den lan sendoa etengabe ekoizten badu soilik.

Goi mailako artikulu asko (gehienak agian) mundu osoko unibertsitate eta enpresa ezberdinetako ikertzaileen arteko lankidetzaren emaitza dira. Ikertzaile baten ibilbidean une garrantzitsua eta oso baliotsua da bere esperientzian oinarrituta ideiak aurkitzeko eta bahetzeko aukera lortzen duenean, baina honen ondoren ere bere lankideek laguntza eskerga ematen jarraitzen dute. Zientzialariek elkarri laguntzen diote ideiak garatzen, artikuluak elkarlanean idazten; eta zientzialariek zientziari egiten dioten ekarpena zenbat eta handiagoa izan, orduan eta errazagoa izango da antzeko pertsonak aurkitzea.

Azkenik, informazioaren dentsitatea eta erabilgarritasuna hain handia da gaur egun, non ikertzaile ezberdinek aldi berean ideia zientifiko oso antzekoak (eta benetan baliotsuak) sortzen dituzte. Zure ideia argitaratzen ez baduzu, ia ziur beste norbaitek argitaratuko dizu. β€œIrabazlea” ez da askotan berrikuntza apur bat lehenago asmatu zuena, apur bat lehenago argitaratu zuena baizik. Edo - ideia ahalik eta guztiz, argi eta sinesgarrien agerian jartzea lortu zuena.

Ilya Segalovich-en izena duen saria. Informatikari buruzko istorio bat eta kaleratzeko argitalpenak

Artikuluak eta datu multzoak

Beraz, artikulu zientifiko bat eraikitzen da ikertzaileak proposatzen duen ideia nagusiaren inguruan. Ideia hau informatikariari egindako ekarpena da. Artikulua ideiaren deskribapen batekin hasten da, esaldi gutxitan formulatua. Ondoren, proposatutako berrikuntzaren laguntzaz ebatzitako arazoen sorta deskribatzen duen sarrera bat dator. Deskribapena eta sarrera, normalean, publiko zabalarentzat ulergarria den hizkuntza sinplean idatzita daude. Sarrera egin ondoren, hizkuntza matematikoan aurkeztutako problemak formalizatu eta notazio zorrotza sartu behar da. Ondoren, sartutako idazkerak erabiliz, proposatutako berrikuntzaren funtsaren adierazpen argi eta zabala sortu behar duzu, eta aurreko eta antzeko metodoekiko ezberdintasunak identifikatu. Adierazpen teoriko guztiak aldez aurretik bildutako ebidentziaren aipamenez lagunduta edo modu independentean frogatu behar dira. Hau hipotesi batzuekin egin daiteke. Adibidez, kasurako froga bat eman dezakezu entrenamendu-datu kopuru infinitua dagoenean (jakinik ez dagoen egoera bat) edo elkarrengandik guztiz independenteak direnean. Artikuluaren amaiera aldera, lortu ahal izan dituen emaitza esperimentalei buruz hitz egiten du zientzialariak.

Ilya Segalovich-en izena duen saria. Informatikari buruzko istorio bat eta kaleratzeko argitalpenak

Kongresuaren antolatzaileek kontratatutako ebaluatzaileek paper bat onartzeko aukera gehiago izan dezaten, atributu bat edo gehiago izan behar ditu. Onartzeko aukerak areagotzen dituen funtsezko faktorea proposatutako ideiaren berritasun zientifikoa da. Askotan, berritasuna lehendik dauden ideiekin lotuta baloratzen da, eta ebaluatzeko lana ez du aztertzaileak egiten, artikuluaren egileak berak baizik. Egokiena, egileak artikuluan zehatz-mehatz kontatu beharko lituzke dauden metodoei buruz eta, ahal bada, bere metodoaren kasu berezi gisa aurkeztea. Horrela, zientzialariak erakusten du onartutako planteamenduek ez dutela beti funtzionatzen, orokortu egin zituela eta formulazio teoriko zabalagoa, malguagoa eta, beraz, eraginkorragoa proposatu zuela. Berritasuna ukaezina bada, bestela ebaluatzaileek artikulua ez dute hain zorrotz baloratzen; adibidez, ingeles eskasari begiak itxi ditzakete.

Berritasuna indartzeko, komeni da datu-multzo batean edo gehiagotan dauden metodoekin alderaketa bat sartzea. Horietako bakoitzak irekia eta onartua izan behar du ingurune akademikoan. Esaterako, ImageNet irudi-biltegia eta institutuetako datu-baseak daude, besteak beste, Modified National Institute of Standards and Technology (MNIST) eta CIFAR (Canadian Institute For Advanced Research). Zailtasuna da datu-multzo "akademiko" hori askotan edukien egituran desberdina dela industriak lantzen dituen datu errealetatik. Datu ezberdinek proposatutako metodoaren emaitza desberdinak esan nahi dituzte. Partzialki industrian lan egiten duten zientzialariak hori kontuan hartzen saiatzen dira eta batzuetan "gure datuetan emaitza halakoa da, baina datu-multzo publikoan - halako eta halako" bezalako klausulak sartzen saiatzen dira.

Gertatzen da proposatutako metodoa datu-base ireki batera guztiz "neurri" dagoela eta ez duela datu errealetan funtzionatzen. Ohiko arazo honi aurre egin diezaiokezu datu-multzo berri eta adierazgarriagoak irekiz, baina askotan enpresek irekitzeko eskubiderik ez duten eduki pribatuez ari gara. Zenbait kasutan, datuen anonimoizazioa (batzuetan konplexua eta zorrotza) egiten dute; pertsona zehatz bat adierazten duten zatiak kentzen dituzte. Adibidez, argazkietako aurpegiak eta zenbakiak ezabatzen dira edo irakurezin bihurtzen dira. Horrez gain, datu-multzoa guztiontzat eskuragarri egon ez ezik, ideiak alderatzea komeni den zientzialarien artean estandar bihurtzeko, beharrezkoa da argitaratzeaz gain, aipaturiko artikulu bereizi bat idaztea ere. hura eta bere abantailak.

Okerragoa da aztertzen ari den gaian datu multzo irekirik ez dagoenean. Orduan, ebaluatzaileak egileak fedeari buruz aurkeztutako emaitzak baino ezin ditu onartu. Teorian, egileak gehiegi balioetsi eta antzeman gabe gera litezke, baina ingurune akademiko batean hori nekez da, zientzialari gehienek zientzia garatzeko nahiaren aurka egiten baitu.

ML-ko hainbat arlotan, ordenagailu bidezko ikusmenean barne, ohikoa da artikuluekin koderako estekak eranstea (normalean GitHub-era). Artikuluek beraiek kode gutxi daukate edo pseudokodeak dira. Eta hemen, berriz, zailtasunak sortzen dira artikulua enpresa bateko ikertzaile batek idatzi badu, eta ez unibertsitate batekoa. Lehenespenez, korporazio edo startup batean idatzitako kodea NDA etiketa da. Ikertzaileek eta beren lankideek gogor lan egin behar dute deskribatzen den ideiarekin lotutako kodea barne-biltegietatik eta zalantzarik gabe itxietatik bereizteko.

Argitaratzeko aukera aukeratutako gaiaren garrantziaren araberakoa da ere. Garrantzia, neurri handi batean, produktuek eta zerbitzuek agintzen dute: korporazio edo startup batek zerbitzu berri bat eraikitzeko edo artikulu bateko ideia batean oinarrituta dagoen bat hobetzeko interesa badu, hori abantaila da.

Ilya Segalovich-en izena duen saria. Informatikari buruzko istorio bat eta kaleratzeko argitalpenak

Esan bezala, informatikako lanak oso gutxitan idazten dira bakarrik. Baina, oro har, egileetako batek besteek baino askoz denbora eta esfortzu gehiago ematen du. Berritasun zientifikoari egin dion ekarpenik handiena da. Egileen zerrendan, pertsona hori adierazten da lehenik eta, etorkizunean, artikulu bati erreferentzia egitean, hura bakarrik aipatu dezakete (adibidez, "Ivanov et al" - "Ivanov eta beste batzuk" latinetik itzulita). Dena den, besteen ekarpenak ere oso baliotsuak dira, bestela ezinezkoa da egileen zerrendan egotea.

Berrikuspen prozesua

Ponentzia normalean hitzaldia baino hilabete batzuk lehenago onartzeari uzten diote. Artikulu bat bidali ondoren, ebaluatzaileek 3-5 aste dituzte irakurtzeko, ebaluatzeko eta iruzkintzeko. Hori itsu bakarreko sistemaren arabera gertatzen da, egileek ebaluatzaileen izenak ikusten ez dituztenean, edo itsu bikoitza, ebaluatzaileek beraiek egileen izenak ikusten ez dituztenean. Bigarren aukera inpartzialagoa da: hainbat lan zientifikok frogatu dute egilearen ospeak ebaluatzailearen erabakian eragina duela. Esaterako, kontsidera dezake jada argitaratutako artikulu ugari dituen zientzialari batek a priori balorazio handiagoa izatea merezi duela.

Gainera, itsu bikoitzaren kasuan ere, ebaluatzaileak ziurrenik asmatuko du egilearen esparru berean lan egiten badu. Horrez gain, berrikuspenaren unean, baliteke artikulua dagoeneko arXiv datu-basean argitaratuta egotea, artikulu zientifikoen biltegirik handiena. Jardunaldien antolatzaileek ez dute hori debekatzen, baina arXiv-erako argitalpenetan beste izenburu bat eta beste laburpen bat erabiltzea gomendatzen dute. Baina artikulua bertan argitaratu bazen, oraindik ez da zaila izango aurkitzea.

Beti daude artikulu bat ebaluatzen duten hainbat ebaluatzaile. Horietako bati meta-berrikuslearen rola esleitzen zaio, eta bere lankideen epaiak aztertu eta azken erabakia hartu behar ditu soilik. Ebaluatzaileak artikuluan ados ez badaude, meta-errebisatzaileak ere irakur dezake osotasunerako.

Batzuetan, balorazioa eta iruzkinak aztertu ondoren, egileak aukera du iritzi-emailearekin eztabaidan sartzeko; bere erabakia alda dezan konbentzitzeko aukera ere badago (hala ere, sistema horrek ez du funtzionatzen konferentzia guztietan, eta are gutxiago posible da epaian larriki eragitea). Eztabaidan, ezin duzu beste lan zientifiko batzuetara aipatu, artikuluan lehendik aipatzen diren horiek izan ezik. Ebaluatzaileari artikuluaren edukia hobeto ulertzen soilik "lagundu" diezaiokezu.

Ilya Segalovich-en izena duen saria. Informatikari buruzko istorio bat eta kaleratzeko argitalpenak

Jardunaldiak eta aldizkariak

Informatikako artikuluak maizago bidaltzen dira kongresuetara aldizkari zientifikoetara baino. Hau gertatzen da aldizkarien argitalpenek betetzeko zailagoak diren eskakizunak dituztelako, eta parekideen berrikuspen prozesuak hilabeteak edo urteak ere iraun ditzake. Informatika oso azkar mugitzen den arloa da, eta, beraz, egileak normalean ez daude horrenbeste itxaron nahi argitaratzeko. Dena den, kongresurako jada onartua izan den artikulu bat osatu daiteke (adibidez, emaitza zehatzagoak aurkeztuz) eta espazio murrizketak hain zorrotzak ez diren aldizkari batean argitaratu.

Jardunaldietako ekitaldiak

Kongresuan onartutako artikuluen egileen presentziaren formatua ebaluatzaileek zehazten dute. Artikuluari argi berdea ematen bazaio, gehienetan kartel-postu bat esleitzen zaizu. Poster bat diapositiba estatiko bat da, artikuluaren laburpena eta ilustrazioak dituena. Hitzaldi-areto batzuk kartel-errenda luzez beteta daude. Egileak denboraren zati garrantzitsu bat bere kartelaren ondoan ematen du, artikuluan interesa duten zientzialariekin komunikatzen.

Ilya Segalovich-en izena duen saria. Informatikari buruzko istorio bat eta kaleratzeko argitalpenak

Ilya Segalovich-en izena duen saria. Informatikari buruzko istorio bat eta kaleratzeko argitalpenak

Parte hartzeko aukera apur bat prestigiotsuago bat tximista-hitzaldi bat da. Berrikusleek artikulua txosten azkar bat egiteko merezi duela uste badute, egileari hiru minutu inguru ematen zaizkio publiko zabalari hitz egiteko. Alde batetik, tximista-hitzaldi bat aukera ona da zure ideia kontatzeko, ez bakarrik kartelarekin interesatu zirenei euren ekimenez. Bestalde, kartelaren bisita proaktiboak prestatuago daude eta zure gai zehatzean murgilduago daude aretoko entzule arrunta baino. Horregatik, txosten azkar batean, oraindik jendea eguneratzeko denbora izan behar duzu.

Ilya Segalovich-en izena duen saria. Informatikari buruzko istorio bat eta kaleratzeko argitalpenak

Normalean, tximista-hitzaldiaren amaieran, egileek kartelaren zenbakia izendatzen dute, entzuleek aurkitu eta artikulua hobeto uler dezaten.

Ilya Segalovich-en izena duen saria. Informatikari buruzko istorio bat eta kaleratzeko argitalpenak

Azken aukera, entzutetsuena, kartela gehi ideiaren erabateko aurkezpena da, istorioa kontatzeko presarik ez dagoenean.

Ilya Segalovich-en izena duen saria. Informatikari buruzko istorio bat eta kaleratzeko argitalpenak

Baina, jakina, zientzialariak - onartutako artikuluen egileak barne - hurrengo kongresura etortzen dira erakusteko ez ezik. Lehenik eta behin, beren arloarekin lotutako kartelak aurkitu ohi dituzte arrazoi agerikoengatik. Eta bigarrenik, garrantzitsua da euren kontaktuen zerrenda zabaltzea etorkizunean lan akademiko bateratua egiteko. Hau ez da ehiza, edo, behintzat, bere lehen etapa, gutxienez artikulu baten edo gehiagoren inguruko ideiak, garapenak eta elkarrekin lan egiteak elkarren artean onuragarria den trukea egiten duena.

Aldi berean, goi-biltzar batean sare produktiboa zaila da denbora librearen guztizko falta dela eta. Aurkezpenetan eta karteletan eztabaidetan egun oso bat igaro ondoren, zientzialariak indarrari eutsi badio eta jadanik jet lag-a gainditu badu, orduan festa askoren batera joaten da. Korporazioek hartzen dituzte -ondorioz, alderdiek sarritan ehiza izaera dute. Aldi berean, gonbidatu askok ez dituzte inola ere lan berri bat aurkitzeko, baina, berriro ere, sarean aritzeko. Arratsaldean ez dago txosten eta kartel gehiago: errazagoa da interesatzen zaizun espezialista "harrapatzea".

Ilya Segalovich-en izena duen saria. Informatikari buruzko istorio bat eta kaleratzeko argitalpenak

Ideiatik ekoizpenera

Informatika korporazioen eta startup-en interesak ingurune akademikoarekin oso lotuta dauden industria gutxietako bat da. NIPS, ICML eta antzeko beste kongresuek industriako jende asko erakartzen dute, ez unibertsitateak bakarrik. Hau ohikoa da informatika arloan, baina alderantziz beste zientzia gehienetan.

Bestalde, artikuluetan aurkezten diren ideia guztiak ez dira berehala doaz zerbitzuak sortzera edo hobetzera. Enpresa baten barruan ere, ikertzaile batek zerbitzuko lankideei estandar zientifikoen arabera aurrerapena duen ideia bat proposa diezaieke eta ezartzeari uko egin diezaieke hainbat arrazoirengatik. Horietako bat dagoeneko aipatu da hemen - hau da artikulua idatzi den datu-multzo β€œakademiko” eta benetako datu-multzoaren arteko aldea. Gainera, ideia baten ezarpena atzeratu egin daiteke, baliabide kopuru handia eskatzen du edo adierazle bakarra hobetu daiteke beste neurgailu batzuk hondatzearen truke.

Ilya Segalovich-en izena duen saria. Informatikari buruzko istorio bat eta kaleratzeko argitalpenak

Egoera salbatzen da garatzaile asko beraiek ikertzaile apur bat izateak. Kongresuetara joaten dira, akademikoekin hizkuntza bera hitz egiten dute, ideiak proposatzen dituzte, batzuetan artikuluen sorkuntzan parte hartzen dute (adibidez, kodea idazten dute), edota egile gisa jarduten dute. Garatzaile bat prozesu akademikoan murgilduta badago, ikerketa departamentuan gertatzen ari dena jarraitzen badu, hitz batean - zientzialariekiko kontrako mugimendua erakusten badu, orduan ideia zientifikoak zerbitzu gaitasun berrietan bihurtzeko zikloa laburtu egiten da.

Ikertzaile gazte guztiei zorte ona eta lorpen handiak opa diegu euren lanean. Argitalpen honek ez badigu ezer berririk esan, baliteke lehen kongresu garrantzitsu batean argitaratu izana. Izena eman prima zeure burua eta arduradun zientifikoak izendatu.

Iturria: www.habr.com

Gehitu iruzkin berria