Ilja Szegalovicsról elnevezett díj. Történet az informatikáról és publikációk bevezetéséről

Ilja Szegalovicsról elnevezett díj. Történet az informatikáról és publikációk bevezetéséről

Ma adjuk át az Ilja Segalovicsról elnevezett tudományos díjat iseg. A számítástechnika területén elért eredményekért ítélik oda. Alap- és posztgraduális hallgatók saját pályázatot nyújthatnak be a díjra vagy tudományos témavezetőket jelöl ki. A díjazottakat az akadémiai közösség és a Yandex képviselői választják ki. A fő kiválasztási kritériumok: publikációk és konferenciákon elhangzott előadások, valamint hozzájárulás a közösség fejlődéséhez.

Az első díjátadóra áprilisban kerül sor. A díj részeként a fiatal tudósok 350 ezer rubelt kapnak, emellett nemzetközi konferenciára is elmenhetnek, mentorral dolgozhatnak, és gyakorlatot is végezhetnek a Yandex kutatási osztályán. A tudományos felügyelők 700 ezer rubelt kapnak.

A díj átadása alkalmából úgy döntöttünk, hogy itt a Habrén beszélünk a számítástechnika világában elért siker kritériumairól. Egyes Habr-olvasók már ismerik ezeket a kritériumokat, míg mások hamis benyomást kelthetnek róluk. Ma áthidaljuk ezt a szakadékot – minden fő témát érintünk, ideértve a cikkeket, konferenciákat, adatkészleteket és a tudományos ötletek szolgáltatásokba való átültetését.

Az informatika területén dolgozó tudósok számára a siker fő kritériuma, hogy tudományos munkájukat publikálják az egyik legjelentősebb nemzetközi konferencián. Ez az első „ellenőrző pont” a kutató munkájának elismeréséhez. Például a gépi tanulás területén általában megkülönböztetik a gépi tanulás nemzetközi konferenciáját (ICML) és a neurális információfeldolgozó rendszerek konferenciáját (NeurIPS, korábban NIPS). Számos konferencia zajlik az ML meghatározott területeiről, mint például a számítógépes látás, információkeresés, beszédtechnológia, gépi fordítás stb.

Miért tegye közzé ötleteit

Az informatikától távol állóknak az a tévhitük támadhat, hogy jobb titokban tartani a legértékesebb ötleteket, és törekedni arra, hogy hasznot húzzanak egyediségükből. A mi szakterületünkön azonban a valós helyzet ennek pont az ellenkezője. Egy tudós tekintélyét munkái jelentőségéből ítélik meg, az alapján, hogy más tudósok milyen gyakran idézik cikkeit (idézési index). Ez karrierjének fontos jellemzője. A kutató csak akkor lép fel a szakmai ranglétrán, és válik közösségében megbecsültebbé, ha következetesen erős munkát produkál, amelyet publikálnak, híressé válik, és más tudósok munkájának alapját képezi.

Sok kiemelt cikk (talán a legtöbb) a világ különböző egyetemein és vállalataiban dolgozó kutatók együttműködésének eredménye. Egy kutató pályájának fontos és nagyon értékes pillanata, amikor lehetőséget kap arra, hogy tapasztalatai alapján önállóan találjon és szűrjön ki ötleteket – de ezt követően is munkatársai továbbra is felbecsülhetetlen segítséget nyújtanak számára. A tudósok segítenek egymásnak ötletek kidolgozásában, cikkeket írnak közösen – és minél nagyobb mértékben járul hozzá a tudós a tudományhoz, annál könnyebben talál hasonló gondolkodású embereket.

Végül az információk sűrűsége és elérhetősége olyan nagy, hogy a különböző kutatók egyidejűleg nagyon hasonló (és valóban értékes) tudományos elképzelésekkel állnak elő. Ha nem teszed közzé az ötletedet, akkor szinte biztos, hogy valaki más teszi közzé helyetted. Sokszor nem az a „nyertes”, aki kicsit korábban kitalálta az újítást, hanem az, aki kicsit korábban publikálta. Vagy - az, akinek sikerült a lehető legteljesebben, tisztán és legmeggyőzőbben feltárnia az ötletet.

Ilja Szegalovicsról elnevezett díj. Történet az informatikáról és publikációk bevezetéséről

Cikkek és adatkészletek

Tehát egy tudományos cikk a kutató által javasolt fő gondolat köré épül. Ez az ötlet az ő hozzájárulása a számítástechnikához. A cikk az ötlet néhány mondatban megfogalmazott leírásával kezdődik. Ezt követi egy bevezető, amely leírja a javasolt innováció segítségével megoldott problémák körét. A leírás és a bevezető általában egyszerű, széles közönség számára érthető nyelven készül. A bevezetés után szükséges a matematikai nyelven bemutatott problémák formalizálása és szigorú jelölések bevezetése. Ezután a bevezetett jelölések segítségével világos és átfogó megfogalmazást kell készíteni a javasolt innováció lényegéről, és azonosítani kell a korábbi, hasonló módszerektől való eltéréseket. Valamennyi elméleti állítást vagy korábban összeállított bizonyítékokra való hivatkozással kell alátámasztani, vagy önállóan kell bizonyítani. Ez bizonyos feltételezések mellett megtehető. Például bizonyíthat arra az esetre, amikor végtelen mennyiségű képzési adat van (nyilvánvalóan elérhetetlen helyzet), vagy teljesen függetlenek egymástól. A cikk vége felé a tudós azokról a kísérleti eredményekről beszél, amelyeket sikerült megszereznie.

Ilja Szegalovicsról elnevezett díj. Történet az informatikáról és publikációk bevezetéséről

Ahhoz, hogy a konferencia szervezői által felkért lektorok nagyobb valószínűséggel hagyjanak jóvá egy dolgozatot, annak egy vagy több tulajdonsággal kell rendelkeznie. A jóváhagyás esélyét növelő kulcstényező a javasolt ötlet tudományos újszerűsége. Az újdonságot gyakran a már meglévő elképzelésekhez viszonyítva értékelik – és az értékelési munkát nem a lektor, hanem maga a cikk szerzője végzi. Ideális esetben a szerző a cikkben részletesen mesél a meglévő módszerekről, és lehetőség szerint módszerének speciális eseteiként mutassa be azokat. Így a tudós megmutatja, hogy az elfogadott megközelítések nem mindig működnek, általánosította őket, és egy szélesebb, rugalmasabb és ezért hatékonyabb elméleti megfogalmazást javasolt. Ha az újdonság tagadhatatlan, akkor a bírálók egyébként nem olyan válogatósan értékelik a cikket – például szemet hunynak a gyenge angol nyelven.

Az újdonság megerősítése érdekében hasznos, ha egy vagy több adatkészleten összehasonlítást végeznek a meglévő módszerekkel. Mindegyiknek nyitottnak és elfogadottnak kell lennie az akadémiai környezetben. Például létezik az ImageNet képtár és olyan intézetek adatbázisai, mint a Modified National Institute of Standards and Technology (MNIST) és a CIFAR (Canadian Institute for Advanced Research). A nehézséget az okozza, hogy egy ilyen „akadémiai” adatkészlet tartalmi felépítésében gyakran eltér azoktól a valós adatoktól, amelyekkel az iparág foglalkozik. Az eltérő adatok a javasolt módszer eltérő eredményeit jelentik. A részben az iparnak dolgozó tudósok igyekeznek ezt figyelembe venni, és néha olyan felelősségkizárásokat iktatnak be, mint „adatainkon az eredmény ilyen és olyan, de a nyilvános adatállományon – ilyen és olyan”.

Előfordul, hogy a javasolt módszer teljesen „szabott” egy nyílt adatbázishoz, és nem működik valós adatokon. Ez a gyakori probléma leküzdhető új, reprezentatívabb adatkészletek megnyitásával, de gyakran olyan privát tartalmakról beszélünk, amelyeket a cégeknek egyszerűen nincs joguk megnyitni. Egyes esetekben (néha összetett és gondos) anonimizálást végeznek az adatokon - eltávolítanak minden olyan töredéket, amely egy adott személyre mutat. Például a fényképeken az arcok és a számok törlődnek vagy olvashatatlanná válnak. Ráadásul ahhoz, hogy az adathalmaz ne csak mindenki számára elérhető legyen, hanem a tudósok körében is standarddá váljon, amelyen kényelmesen össze lehet hasonlítani az elképzeléseket, nemcsak közzé kell tenni, hanem külön idézett cikket is kell írni róla. és előnyei.

Rosszabb, ha a vizsgált témában nincsenek nyitott adatkészletek. Ekkor a lektor csak a szerző által bemutatott eredményeket tudja elfogadni a hit alapján. Elméletileg a szerző akár túlbecsülhetné is őket, és észrevétlen maradna, de akadémiai környezetben ez nem valószínű, mivel ez ellenkezik a tudósok túlnyomó többségének a tudomány fejlesztése iránti vágyával.

Az ML számos területén, beleértve a számítógépes látást is, az is elterjedt, hogy cikkekkel együtt csatolnak hivatkozásokat a kódhoz (általában a GitHubhoz). Maguk a cikkek vagy nagyon kevés kódot tartalmaznak, vagy pszeudokódok. És itt is nehézségek merülnek fel, ha a cikket egy cég kutatója írja, és nem egyetemi. Alapértelmezés szerint a vállalatban vagy startupban írt kód NDA feliratú. A kutatóknak és munkatársaiknak keményen kell dolgozniuk, hogy a leírt ötlethez kapcsolódó kódot elkülönítsék a belső és minden bizonnyal zárt adattáraktól.

A megjelenés esélye a választott téma relevanciájától is függ. A relevanciát nagymértékben a termékek és a szolgáltatások határozzák meg: ha egy vállalat vagy startup egy új szolgáltatás építésében vagy egy meglévő fejlesztésében érdeklődik egy cikkből származó ötlet alapján, az plusz.

Ilja Szegalovicsról elnevezett díj. Történet az informatikáról és publikációk bevezetéséről

Mint már említettük, a számítástechnikai dolgozatokat ritkán írják egyedül. De általában az egyik szerző sokkal több időt és erőfeszítést költ, mint a többi. Hozzájárulása a tudományos újdonsághoz a legnagyobb. A szerzők listájában először egy ilyen személyt tüntetnek fel - és a jövőben, amikor egy cikkre hivatkoznak, csak megemlíthetik (például „Ivanov et al” - „Ivanov és mások” latinból fordítva). Mások hozzászólásai azonban rendkívül értékesek – különben lehetetlen felkerülni a szerzők listájára.

Felülvizsgálati eljárás

A konferencia előtt néhány hónappal általában leáll a papírok elfogadása. A cikk benyújtása után a bírálóknak 3–5 hetük van a cikk elolvasására, értékelésére és véleményezésére. Ez az egy vak rendszer szerint történik, amikor a szerzők nem látják a lektorok nevét, vagy a kettős vak, amikor maguk a bírálók nem látják a szerzők nevét. A második lehetőség pártatlanabbnak tekinthető: több tudományos közlemény kimutatta, hogy a szerző népszerűsége befolyásolja a bíráló döntését. Például úgy ítélheti meg, hogy az a tudós, akinek nagy száma már publikált, eleve magasabb minősítést érdemel.

Sőt, még a kettős vak esetében is valószínűleg kitalálja a lektor a szerzőt, ha ugyanazon a területen dolgozik. Emellett a cikk a felülvizsgálat időpontjában már megjelenhet az arXiv adatbázisban, a tudományos közlemények legnagyobb tárházában. A konferencia szervezői ezt nem tiltják, de javasolják, hogy az arXiv kiadványaiban más címet és más absztraktot használjanak. De ha a cikk felkerült oda, akkor sem lesz nehéz megtalálni.

Mindig több bíráló értékeli a cikket. Egyikük a metarecenzens szerepkört kapja, akinek csak a kollégái ítéleteit kell áttekintenie, és meghoznia a végső döntést. Ha a lektorok nem értenek egyet a cikkel kapcsolatban, a teljesség kedvéért a metabíráló is elolvashatja.

Néha az értékelés és a megjegyzések áttekintése után a szerzőnek lehetősége nyílik megbeszélést folytatni a bírálóval; még arra is van esély, hogy meggyőzzék a döntésének megváltoztatásáról (egy ilyen rendszer azonban nem minden konferencián működik, és még kevésbé lehet komolyan befolyásolni az ítéletet). A vitában nem hivatkozhat más tudományos munkákra, kivéve a cikkben már hivatkozottakat. Csak „segíthet” a bírálónak a cikk tartalmának jobb megértésében.

Ilja Szegalovicsról elnevezett díj. Történet az informatikáról és publikációk bevezetéséről

Konferenciák és folyóiratok

Számítástechnikai cikkeket gyakrabban nyújtanak be konferenciákra, mint tudományos folyóiratokra. Ennek az az oka, hogy a folyóirat-kiadványok nehezebben teljesíthetők, és a szakértői értékelés folyamata hónapokig vagy akár évekig is eltarthat. A számítástechnika nagyon gyorsan fejlődő terület, így a szerzők általában nem hajlandók ennyit várni a megjelenésre. A konferenciára már elfogadott cikk azonban kiegészíthető (például részletesebb eredmények bemutatásával), és egy olyan folyóiratban publikálható, ahol a helykorlátozás nem olyan szigorú.

Rendezvények a konferencián

A jóváhagyott cikkek szerzőinek a konferencián való jelenlétének formátumát a lektorok határozzák meg. Ha a cikk zöld utat kap, akkor leggyakrabban plakátállványt kap. A poszter egy statikus dia a cikk összefoglalásával és illusztrációkkal. Néhány konferenciaterem tele van hosszú poszterállványokkal. A szerző ideje jelentős részét plakátja közelében tölti, és a cikk iránt érdeklődő tudósokkal kommunikál.

Ilja Szegalovicsról elnevezett díj. Történet az informatikáról és publikációk bevezetéséről

Ilja Szegalovicsról elnevezett díj. Történet az informatikáról és publikációk bevezetéséről

Valamivel presztízsesebb részvételi lehetőség a villámbeszélgetés. Ha a bírálók a cikket érdemesnek tartják egy gyorsjelentésre, a szerző körülbelül három percet kap arra, hogy széles közönséghez szóljon. Egy villámbeszélgetés egyrészt jó alkalom arra, hogy ne csak azoknak meséljen ötletéről, akik saját kezdeményezésükből érdeklődtek a plakát iránt. Másrészt a proaktív plakátlátogatók felkészültebbek és jobban elmerülnek a konkrét témában, mint az átlagos hallgató a teremben. Ezért egy gyorsjelentésben még mindig kell maradnia, hogy naprakészen tájékoztassa az embereket.

Ilja Szegalovicsról elnevezett díj. Történet az informatikáról és publikációk bevezetéséről

Általában a szerzők villámbeszédük végén megnevezik a plakát számát, hogy a hallgatók megtalálják és jobban megértsék a cikket.

Ilja Szegalovicsról elnevezett díj. Történet az informatikáról és publikációk bevezetéséről

Az utolsó, legrangosabb lehetőség egy poszter és az ötlet teljes körű bemutatása, amikor már nem kell rohanni a történet elmesélésével.

Ilja Szegalovicsról elnevezett díj. Történet az informatikáról és publikációk bevezetéséről

De természetesen a tudósok – köztük a jóváhagyott cikkek szerzői – nem csak azért jönnek el a következő konferenciára, hogy mutogassanak. Először is hajlamosak a szakterületükhöz kapcsolódó plakátokat találni nyilvánvaló okokból. Másodsorban pedig fontos számukra, hogy a jövőben közös tudományos munka céljából bővítsék kapcsolattartóik listáját. Ez nem a vadászat – vagy legalábbis a legelső szakasza, amelyet legalább egy kölcsönösen előnyös eszmecsere, fejlesztés és egy vagy több cikken való közös munka követ.

Ugyanakkor a produktív hálózatépítés egy csúcskonferencián a szabadidő teljes hiánya miatt nehézkes. Ha az előadásokon és a plakátokon folytatott beszélgetéseken eltöltött egész nap után a tudós megőrizte erejét, és már leküzdötte a jet lag-ot, akkor elmegy a sok buli valamelyikére. Vállalatoknak adnak otthont – ennek következtében a felek gyakran vadászatosabbak. Ugyanakkor sok vendég egyáltalán nem új álláskeresésre használja őket, hanem ismételten hálózatépítésre. Esténként nincs több riport és plakát - könnyebb „elkapni” az érdeklődő szakembert.

Ilja Szegalovicsról elnevezett díj. Történet az informatikáról és publikációk bevezetéséről

Az ötlettől a gyártásig

A számítástechnika azon kevés iparágak egyike, ahol a vállalatok és startupok érdekei szorosan kapcsolódnak az akadémiai környezethez. A NIPS, ICML és más hasonló konferenciák sok embert vonzanak az iparból, nem csak az egyetemekről. Ez jellemző az informatika területére, de fordítva a legtöbb más tudományra.

Másrészt nem minden cikkben bemutatott ötlet irányul azonnal szolgáltatások létrehozására vagy fejlesztésére. A kutató akár egy cégen belül is javasolhat a szolgálat munkatársainak egy tudományos mércével mérve áttörést jelentő ötletet, és ennek megvalósítását több okból megtagadják. Az egyiket már említettük itt - ez a különbség a cikk írásakor használt „akadémiai” és a valós adatkészlet között. Emellett előfordulhat, hogy egy ötlet megvalósítása késik, nagy mennyiségű erőforrást igényel, vagy csak egy mutatót javíthat más mérőszámok romlása árán.

Ilja Szegalovicsról elnevezett díj. Történet az informatikáról és publikációk bevezetéséről

A helyzetet az menti, hogy sok fejlesztő maga is kicsit kutató. Konferenciákon vesznek részt, egy nyelvet beszélnek az akadémikusokkal, ötleteket adnak elő, néha részt vesznek cikkek létrehozásában (például kódírásban), vagy akár maguk is szerzőként lépnek fel. Ha egy fejlesztő belemerül az akadémiai folyamatba, követi a kutatási osztályon zajló eseményeket, egyszóval - ha ellenmozgást mutat a tudósok felé, akkor lerövidül a tudományos ötletek új szolgáltatási képességekké alakításának ciklusa.

Minden fiatal kutatónak sok sikert és kiváló eredményeket kívánunk munkájához. Ha ez a bejegyzés nem mondott neked semmi újat, akkor lehet, hogy már publikáltál egy csúcskonferencián. Regisztráljon a prémium magát, és jelöljön ki tudományos témavezetőket.

Forrás: will.com

Hozzászólás