Premiul numit după Ilya Segalovici. O poveste despre informatică și publicații de lansare

Premiul numit după Ilya Segalovici. O poveste despre informatică și publicații de lansare

Astăzi lansăm un premiu științific numit după Ilya Segalovici iseg. Acesta va fi acordat pentru realizări în domeniul informaticii. Studenți de licență și postuniversitare pot depune propria cerere pentru premiu sau numiți supraveghetori științifici. Laureații vor fi aleși de reprezentanți ai comunității academice și Yandex. Principalele criterii de selecție: publicații și prezentări la conferințe, precum și contribuția la dezvoltarea comunității.

Prima ceremonie de premiere va avea loc în aprilie. Ca parte a premiului, tinerii oameni de știință vor primi 350 de mii de ruble și, în plus, vor putea să meargă la o conferință internațională, să lucreze cu un mentor și să facă un stagiu în departamentul de cercetare Yandex. Supraveghetorii științifici vor primi 700 de mii de ruble.

Cu ocazia lansării premiului, am decis să vorbim aici pe Habré despre criteriile succesului în lumea informatică. Unii cititori Habr sunt deja familiarizați cu aceste criterii, în timp ce alții ar putea avea o impresie falsă despre ele. Astăzi vom acoperi acest decalaj - vom atinge toate subiectele principale, inclusiv articole, conferințe, seturi de date și transferul ideilor științifice în servicii.

Pentru oamenii de știință din domeniul informaticii, principalul criteriu de succes este publicarea lucrărilor lor științifice la una dintre cele mai importante conferințe internaționale. Acesta este primul „punct de control” pentru recunoașterea muncii cercetătorului. De exemplu, în domeniul învățării automate în general, se disting Conferința Internațională pentru Învățare Mașină (ICML) și Conferința privind Sistemele de Procesare a Informației Neurale (NeurIPS, anterior NIPS). Există multe conferințe pe domenii specifice ale ML, cum ar fi viziunea computerizată, recuperarea informațiilor, tehnologia vorbirii, traducerea automată etc.

De ce să-ți publici ideile

Oamenii care sunt departe de informatică pot avea concepția greșită că este mai bine să păstreze secrete cele mai valoroase idei și să se străduiască să profite de unicitatea lor. Cu toate acestea, situația reală în domeniul nostru este exact invers. Autoritatea unui om de știință este judecată după semnificația lucrărilor sale, după cât de des articolele sale sunt citate de alți oameni de știință (index de citare). Aceasta este o caracteristică importantă a carierei sale. Un cercetător urcă pe scara profesională, devenind mai respectat în comunitatea sa, numai dacă produce în mod constant lucrări puternice care sunt publicate, devin celebre și formează baza muncii altor oameni de știință.

Multe articole de top (poate cele mai multe) sunt rezultatul colaborării dintre cercetători de la diferite universități și companii din întreaga lume. Un moment important și foarte valoros în cariera unui cercetător este atunci când acesta are ocazia să găsească și să trimită singur idei pe baza experienței sale - dar și după aceasta, colegii săi continuă să-i ofere un ajutor neprețuit. Oamenii de știință se ajută reciproc să dezvolte idei, scriu articole în colaborare - și cu cât contribuția omului de știință la știință este mai mare, cu atât îi este mai ușor să găsească oameni care au aceleași idei.

În cele din urmă, densitatea și disponibilitatea informațiilor este acum atât de mare încât diferiți cercetători vin simultan cu idei științifice foarte asemănătoare (și cu adevărat valoroase). Dacă nu îți publici ideea, aproape sigur că altcineva o va publica pentru tine. „Câștigătorul” nu este adesea cel care a venit cu inovația puțin mai devreme, ci cel care a publicat-o puțin mai devreme. Sau – cel care a reușit să dezvăluie ideea cât mai complet, clar și convingător.

Premiul numit după Ilya Segalovici. O poveste despre informatică și publicații de lansare

Articole și seturi de date

Deci, un articol științific este construit în jurul ideii principale pe care o propune cercetătorul. Această idee este contribuția lui la informatică. Articolul începe cu o descriere a ideii, formulată în câteva propoziții. Aceasta este urmată de o introducere care descrie gama de probleme rezolvate cu ajutorul inovației propuse. Descrierea și introducerea sunt de obicei scrise într-un limbaj simplu, care este ușor de înțeles pentru un public larg. După introducere, este necesară formalizarea problemelor prezentate în limbajul matematic și introducerea notării stricte. Apoi, folosind notațiile introduse, trebuie să creați o declarație clară și cuprinzătoare a esenței inovației propuse și să identificați diferențele față de metodele anterioare, similare. Toate afirmațiile teoretice trebuie fie să fie susținute de referințe la dovezi compilate anterior, fie dovedite în mod independent. Acest lucru se poate face cu unele presupuneri. De exemplu, puteți da o dovadă pentru cazul în care există o cantitate infinită de date de antrenament (o situație evident de neatins) sau sunt complet independente unele de altele. Spre finalul articolului, omul de știință vorbește despre rezultatele experimentale pe care le-a putut obține.

Premiul numit după Ilya Segalovici. O poveste despre informatică și publicații de lansare

Pentru ca recenzentii recrutați de organizatorii conferinței să aibă mai multe șanse să aprobe o lucrare, aceasta trebuie să aibă unul sau mai multe atribute. Un factor cheie care crește șansele de aprobare este noutatea științifică a ideii propuse. Adesea, noutatea este evaluată în raport cu ideile deja existente - iar munca de evaluare a acesteia nu este efectuată de recenzent, ci de autorul articolului însuși. În mod ideal, autorul ar trebui să spună în detaliu în articol despre metodele existente și, dacă este posibil, să le prezinte ca cazuri speciale ale metodei sale. Astfel, omul de știință arată că abordările acceptate nu funcționează întotdeauna, că le-a generalizat și a propus o formulare teoretică mai largă, mai flexibilă și deci mai eficientă. Dacă noutatea este de netăgăduit, în caz contrar, recenzenții evaluează articolul nu atât de pretențios - de exemplu, pot închide ochii la limba engleză săracă.

Pentru a consolida noutatea, este util să includeți o comparație cu metodele existente pe unul sau mai multe seturi de date. Fiecare dintre ei ar trebui să fie deschis și acceptat în mediul academic. De exemplu, există depozitul de imagini ImageNet și bazele de date ale unor institute precum Institutul Național Modificat de Standarde și Tehnologie (MNIST) și CIFAR (Institutul Canadien pentru Cercetare Avansată). Dificultatea este că un astfel de set de date „academice” diferă adesea în structura conținutului de datele reale cu care se ocupă industria. Date diferite înseamnă rezultate diferite ale metodei propuse. Oamenii de știință care lucrează parțial pentru industrie încearcă să ia în considerare acest lucru și, uneori, introduc clauze de declinare a răspunderii de genul „pe datele noastre, rezultatul este așa și cutare, dar pe setul de date publice – cutare și cutare”.

Se întâmplă ca metoda propusă să fie complet „adaptată” unei baze de date deschise și să nu funcționeze pe date reale. Puteți combate această problemă comună prin deschiderea unor seturi de date noi, mai reprezentative, dar adesea vorbim de conținut privat pe care companiile pur și simplu nu au dreptul să-l deschidă. În unele cazuri, efectuează anonimizarea datelor (uneori complexă și minuțioasă) - elimină orice fragmente care indică o anumită persoană. De exemplu, fețele și numerele din fotografii sunt șterse sau făcute ilizibile. În plus, pentru ca setul de date să fie disponibil nu numai pentru toată lumea, ci să devină un standard în rândul oamenilor de știință pe care este convenabil să se compare ideile, este necesar nu numai să-l publice, ci și să scrie un articol separat citat despre ea și avantajele sale.

Este mai rău atunci când nu există seturi de date deschise în subiectul studiat. Atunci recenzentul poate accepta doar rezultatele prezentate de autor despre credință. Teoretic, autorul ar putea chiar să le supraestimeze și să rămână nedetectat, dar într-un mediu academic acest lucru este puțin probabil, deoarece este împotriva dorinței marii majorități a oamenilor de știință de a dezvolta știința.

Într-un număr de domenii ale ML, inclusiv viziunea computerizată, este, de asemenea, obișnuit să atașați link-uri la cod (de obicei către GitHub) cu articole. Articolele în sine fie conțin foarte puțin cod, fie sunt pseudocod. Și aici, din nou, apar dificultăți dacă articolul este scris de un cercetător de la o companie, și nu de la o universitate. În mod implicit, codul scris într-o corporație sau startup este etichetat NDA. Cercetătorii și colegii lor trebuie să muncească din greu pentru a separa codul legat de ideea descrisă de depozitele interne și cu siguranță închise.

Șansa publicării depinde și de relevanța temei alese. Relevanța este dictată în mare măsură de produse și servicii: dacă o corporație sau un startup este interesat să construiască un nou serviciu sau să îmbunătățească unul existent pe baza unei idei dintr-un articol, acesta este un plus.

Premiul numit după Ilya Segalovici. O poveste despre informatică și publicații de lansare

După cum am menționat deja, lucrările de informatică sunt rareori scrise singure. Dar, de regulă, unul dintre autori petrece mult mai mult timp și efort decât ceilalți. Contribuția sa la noutatea științifică este cea mai mare. În lista autorilor, o astfel de persoană este indicată mai întâi - iar în viitor, atunci când se referă la un articol, ei o pot menționa doar (de exemplu, „Ivanov et al” - „Ivanov și alții” tradus din latină). Cu toate acestea, contribuțiile altora sunt și ele extrem de valoroase - altfel este imposibil să fii pe lista autorilor.

Procesul de revizuire

De obicei, lucrările nu mai sunt acceptate cu câteva luni înainte de conferință. După ce un articol este trimis, recenzenții au la dispoziție 3-5 săptămâni pentru a-l citi, evalua și comenta. Acest lucru se întâmplă conform sistemului single blind, când autorii nu văd numele autorilor, sau dublu blind, când recenzenții înșiși nu văd numele autorilor. A doua opțiune este considerată mai imparțială: mai multe lucrări științifice au arătat că popularitatea autorului influențează decizia recenzentului. De exemplu, el poate considera că un om de știință cu un număr mare de articole deja publicate este a priori demn de un rating mai mare.

Mai mult, chiar și în cazul double blind, recenzorul va ghici probabil autorul dacă lucrează în același domeniu. În plus, la momentul revizuirii, articolul poate fi deja publicat în baza de date arXiv, cel mai mare depozit de lucrări științifice. Organizatorii conferinței nu interzic acest lucru, dar recomandă utilizarea unui alt titlu și a unui rezumat diferit în publicațiile pentru arXiv. Dar dacă articolul a fost postat acolo, tot nu va fi greu de găsit.

Există întotdeauna mai mulți recenzenți care evaluează un articol. Unui dintre ei i se atribuie rolul de meta-revizor, care trebuie doar să revizuiască verdictele colegilor săi și să ia decizia finală. Dacă recenzenții nu sunt de acord cu articolul, meta-revizorul îl poate citi și pentru a fi complet.

Uneori, după trecerea în revistă a ratingului și a comentariilor, autorul are posibilitatea de a intra într-o discuție cu recenzentul; există chiar șansa de a-l convinge să-și schimbe decizia (totuși, un astfel de sistem nu funcționează pentru toate conferințele și este cu atât mai puțin posibil să se influențeze serios verdictul). În discuție, nu vă puteți referi la alte lucrări științifice, cu excepția celor deja menționate în articol. Puteți doar „a ajuta” recenzentul să înțeleagă mai bine conținutul articolului.

Premiul numit după Ilya Segalovici. O poveste despre informatică și publicații de lansare

Conferințe și reviste

Articolele de informatică sunt prezentate mai des la conferințe decât la reviste științifice. Acest lucru se datorează faptului că publicațiile de reviste au cerințe care sunt mai dificil de îndeplinit, iar procesul de evaluare inter pares poate dura luni sau chiar ani. Informatica este un domeniu în mișcare foarte rapidă, așa că autorii nu sunt de obicei dispuși să aștepte atât de mult pentru publicare. Cu toate acestea, un articol care a fost deja acceptat pentru conferință poate fi apoi completat (de exemplu, prin prezentarea unor rezultate mai detaliate) și publicat într-un jurnal în care restricțiile de spațiu nu sunt atât de stricte.

Evenimente la conferință

Formatul pentru prezența autorilor articolelor aprobate la conferință este determinat de recenzori. Dacă articolului i se dă undă verde, atunci cel mai adesea vi se alocă un stand de afiș. Un poster este un diapozitiv static cu un rezumat al articolului și ilustrații. Unele săli de conferințe sunt pline cu șiruri lungi de standuri de afișe. Autorul își petrece o parte semnificativă a timpului lângă posterul său, comunicând cu oamenii de știință care sunt interesați de articol.

Premiul numit după Ilya Segalovici. O poveste despre informatică și publicații de lansare

Premiul numit după Ilya Segalovici. O poveste despre informatică și publicații de lansare

O opțiune ceva mai prestigioasă pentru participare este o discuție fulger. Dacă recenzenții consideră articolul demn de un raport rapid, autorului i se acordă aproximativ trei minute pentru a vorbi unui public larg. Pe de o parte, o discuție fulger este un bun prilej de a spune despre ideea ta nu numai celor care au devenit interesați de afiș din proprie inițiativă. Pe de altă parte, vizitatorii afișelor proactivi sunt mai pregătiți și mai cufundați în subiectul dvs. specific decât ascultătorul obișnuit din sală. Prin urmare, într-un raport rapid, mai trebuie să aveți timp să aduceți oamenii la curent.

Premiul numit după Ilya Segalovici. O poveste despre informatică și publicații de lansare

De obicei, la sfârșitul discursului lor fulger, autorii numesc numărul posterului, astfel încât ascultătorii să-l poată găsi și să înțeleagă mai bine articolul.

Premiul numit după Ilya Segalovici. O poveste despre informatică și publicații de lansare

Ultima opțiune, cea mai prestigioasă, este un poster plus o prezentare cu drepturi depline a ideii, atunci când nu mai este nevoie să te grăbești să spui povestea.

Premiul numit după Ilya Segalovici. O poveste despre informatică și publicații de lansare

Dar, desigur, oamenii de știință - inclusiv autorii articolelor aprobate - vin la următoarea conferință nu doar pentru a se arăta. În primul rând, ei tind să găsească postere legate de domeniul lor din motive evidente. Și în al doilea rând, este important pentru ei să-și extindă lista de contacte în scopul activității academice comune în viitor. Aceasta nu este vânătoare - sau, cel puțin, prima sa etapă, care este cel puțin urmată de un schimb de idei reciproc avantajos, dezvoltări și lucru în comun la unul sau mai multe articole.

În același timp, crearea de rețele productive la o conferință de top este dificilă din cauza lipsei totale de timp liber. Dacă, după o zi întreagă petrecută la prezentări și la discuții la postere, omul de știință și-a păstrat forțele și a depășit deja jet lag-ul, atunci merge la una dintre numeroasele petreceri. Sunt găzduite de corporații - drept urmare, petrecerile au adesea un caracter mai vânător. În același timp, mulți oaspeți le folosesc deloc pentru a-și găsi un nou loc de muncă, ci, din nou, pentru crearea de rețele. Seara nu mai există rapoarte și postere - este mai ușor să „prindeți” specialistul care vă interesează.

Premiul numit după Ilya Segalovici. O poveste despre informatică și publicații de lansare

De la idee la producție

Informatica este una dintre puținele industrii în care interesele corporațiilor și startup-urilor sunt strâns legate de mediul academic. NIPS, ICML și alte conferințe similare atrag o mulțime de oameni din industrie, nu doar universități. Acest lucru este tipic pentru domeniul informaticii, dar invers pentru majoritatea celorlalte științe.

Pe de altă parte, nu toate ideile prezentate în articole merg imediat spre crearea sau îmbunătățirea serviciilor. Chiar și în cadrul unei singure companii, un cercetător poate propune colegilor din serviciu o idee care este inovatoare în raport cu standardele științifice și poate primi un refuz de a o implementa din mai multe motive. Unul dintre ele a fost deja menționat aici - aceasta este diferența dintre setul de date „academice” pe care a fost scris articolul și setul de date real. În plus, implementarea unei idei poate fi întârziată, poate necesita o cantitate mare de resurse sau poate îmbunătăți un singur indicator cu prețul deteriorării altor indicatori.

Premiul numit după Ilya Segalovici. O poveste despre informatică și publicații de lansare

Situația este salvată de faptul că mulți dezvoltatori înșiși sunt puțin cercetători. Aceștia participă la conferințe, vorbesc aceeași limbă cu cadrele universitare, propun idei, uneori participă la crearea de articole (de exemplu, scrierea codului) sau chiar acționează în calitate de autori. Dacă un dezvoltator este cufundat în procesul academic, urmărește ceea ce se întâmplă în departamentul de cercetare, într-un cuvânt - dacă demonstrează o mișcare contrară față de oamenii de știință, atunci ciclul de transformare a ideilor științifice în noi capabilități de servicii se scurtează.

Le dorim tuturor tinerilor cercetători mult succes și mari realizări în munca lor. Dacă această postare nu v-a spus nimic nou, atunci este posibil să fi publicat deja la o conferință de top. Înregistrează-te pentru premium dumneavoastră și numiți supraveghetori științifici.

Sursa: www.habr.com

Adauga un comentariu