Çmimi me emrin Ilya Segalovich. Një histori rreth shkencës kompjuterike dhe publikimeve të lançimit

Çmimi me emrin Ilya Segalovich. Një histori rreth shkencës kompjuterike dhe publikimeve të lançimit

Sot po lançojmë një çmim shkencor me emrin Ilya Segalovich iseg. Ai do të shpërblehet për arritjet në fushën e shkencave kompjuterike. Studentë universitar dhe pasuniversitar mund të paraqesin aplikimin e tyre për çmimin ose të emërojë mbikëqyrës shkencorë. Laureatët do të zgjidhen nga përfaqësues të komunitetit akademik dhe Yandex. Kriteret kryesore të përzgjedhjes: publikimet dhe prezantimet në konferenca, si dhe kontributi në zhvillimin e komunitetit.

Ceremonia e parë e ndarjes së çmimeve do të mbahet në prill. Si pjesë e çmimit, shkencëtarët e rinj do të marrin 350 mijë rubla, dhe përveç kësaj, ata do të jenë në gjendje të shkojnë në një konferencë ndërkombëtare, të punojnë me një mentor dhe t'i nënshtrohen një stazhi në departamentin e kërkimit Yandex. Mbikëqyrësit shkencorë do të marrin 700 mijë rubla.

Me rastin e lansimit të çmimit, vendosëm të flasim këtu në Habré për kriteret e suksesit në botën e shkencës kompjuterike. Disa lexues të Habr janë tashmë të njohur me këto kritere, ndërsa të tjerë mund të kenë një përshtypje të rreme për to. Sot do ta kapërcejmë këtë hendek - do të prekim të gjitha temat kryesore, duke përfshirë artikujt, konferencat, grupet e të dhënave dhe transferimin e ideve shkencore në shërbime.

Për shkencëtarët në fushën e informatikës, kriteri kryesor i suksesit është publikimi i punës së tyre shkencore në një nga konferencat më të mira ndërkombëtare. Ky është "pika e kontrollit" e parë për njohjen e punës së studiuesit. Për shembull, në fushën e mësimit të makinerive në përgjithësi, dallohen Konferenca Ndërkombëtare për Mësimin e Makinerisë (ICML) dhe Konferenca për Sistemet e Përpunimit të Informacionit Neural (NeurIPS, më parë NIPS). Ka shumë konferenca në fusha specifike të ML, të tilla si vizioni kompjuterik, marrja e informacionit, teknologjia e të folurit, përkthimi me makinë, etj.

Pse të publikoni idetë tuaja

Njerëzit që janë larg shkencës kompjuterike mund të kenë keqkuptimin se është më mirë të mbahen sekret idetë më të vlefshme dhe të përpiqen të përfitojnë nga veçantia e tyre. Megjithatë, situata reale në fushën tonë është pikërisht e kundërta. Autoriteti i një shkencëtari gjykohet nga rëndësia e veprave të tij, nga sa shpesh artikujt e tij citohen nga shkencëtarë të tjerë (indeksi i citimit). Kjo është një karakteristikë e rëndësishme e karrierës së tij. Një studiues ngjitet në shkallët profesionale, duke u bërë më i respektuar në komunitetin e tij, vetëm nëse ai vazhdimisht prodhon një punë të fortë që botohet, bëhet i famshëm dhe përbën bazën për punën e shkencëtarëve të tjerë.

Shumë artikuj kryesorë (ndoshta shumica) janë rezultat i bashkëpunimit midis studiuesve në universitete dhe kompani të ndryshme në mbarë botën. Një moment i rëndësishëm dhe shumë i vlefshëm në karrierën e një studiuesi është kur atij i jepet mundësia të gjejë dhe të analizojë vetë idetë bazuar në përvojën e tij - por edhe pas kësaj, kolegët e tij vazhdojnë t'i ofrojnë ndihmë të paçmuar. Shkencëtarët ndihmojnë njëri-tjetrin të zhvillojnë ide, të shkruajnë artikuj në bashkëpunim - dhe sa më i madh të jetë kontributi i shkencëtarit në shkencë, aq më e lehtë është për të që të gjejë njerëz me të njëjtin mendim.

Më në fund, dendësia dhe disponueshmëria e informacionit është tani aq e madhe sa studiues të ndryshëm njëkohësisht dalin me ide shkencore shumë të ngjashme (dhe vërtet të vlefshme). Nëse ju nuk e publikoni idenë tuaj, dikush tjetër me siguri do ta publikojë atë për ju. “Fituesi” shpesh nuk është ai që e ka shpikur risinë pak më herët, por ai që e ka publikuar pak më herët. Ose - ai që arriti të zbulojë idenë sa më të plotë, të qartë dhe bindëse.

Çmimi me emrin Ilya Segalovich. Një histori rreth shkencës kompjuterike dhe publikimeve të lançimit

Artikujt dhe grupet e të dhënave

Pra, një artikull shkencor ndërtohet rreth idesë kryesore që propozon studiuesi. Kjo ide është kontributi i tij në shkencën kompjuterike. Artikulli fillon me një përshkrim të idesë, të formuluar në disa fjali. Kjo pasohet nga një hyrje që përshkruan gamën e problemeve të zgjidhura me ndihmën e inovacionit të propozuar. Përshkrimi dhe hyrja zakonisht shkruhen në gjuhë të thjeshtë që është e kuptueshme për një audiencë të gjerë. Pas hyrjes, është e nevojshme të zyrtarizohen problemet e paraqitura në gjuhën matematikore dhe të futet një shënim i rreptë. Pastaj, duke përdorur shënimet e prezantuara, duhet të krijoni një deklaratë të qartë dhe gjithëpërfshirëse të thelbit të inovacionit të propozuar dhe të identifikoni ndryshimet nga metodat e mëparshme, të ngjashme. Të gjitha deklaratat teorike ose duhet të mbështeten nga referenca në provat e përpiluara më parë, ose të vërtetohen në mënyrë të pavarur. Kjo mund të bëhet me disa supozime. Për shembull, mund të jepni një provë për rastin kur ka një sasi të pafundme të dhënash trajnimi (një situatë dukshëm e paarritshme) ose ato janë plotësisht të pavarura nga njëra-tjetra. Në fund të artikullit, shkencëtari flet për rezultatet eksperimentale që ai arriti të merrte.

Çmimi me emrin Ilya Segalovich. Një histori rreth shkencës kompjuterike dhe publikimeve të lançimit

Në mënyrë që recensuesit e rekrutuar nga organizatorët e konferencës të kenë më shumë gjasa për të miratuar një punim, ai duhet të ketë një ose më shumë atribute. Një faktor kyç që rrit shanset e miratimit është risia shkencore e idesë së propozuar. Shpesh, risia vlerësohet në lidhje me idetë tashmë ekzistuese - dhe puna për vlerësimin e saj nuk kryhet nga recensuesi, por nga vetë autori i artikullit. Në mënyrë ideale, autori duhet të tregojë në detaje në artikull për metodat ekzistuese dhe, nëse është e mundur, t'i paraqesë ato si raste të veçanta të metodës së tij. Kështu, shkencëtari tregon se qasjet e pranuara nuk funksionojnë gjithmonë, se ai i përgjithësoi ato dhe propozoi një formulim teorik më të gjerë, më fleksibël dhe për rrjedhojë më efektiv. Nëse risia është e pamohueshme, atëherë përndryshe recensentët e vlerësojnë artikullin jo aq të saktë - për shembull, ata mund të mbyllin një sy ndaj anglishtes së dobët.

Për të përforcuar risinë, është e dobishme të përfshihet një krahasim me metodat ekzistuese në një ose më shumë grupe të dhënash. Secila prej tyre duhet të jetë e hapur dhe e pranuar në mjedisin akademik. Për shembull, ekziston depoja e imazheve ImageNet dhe bazat e të dhënave të instituteve të tilla si Instituti Kombëtar i Modifikuar i Standardeve dhe Teknologjisë (MNIST) dhe CIFAR (Instituti Kanadez për Kërkime të Avancuara). Vështirësia është se një grup i tillë i të dhënave "akademike" shpesh ndryshon në strukturën e përmbajtjes nga të dhënat reale me të cilat merret industria. Të dhëna të ndryshme nënkupton rezultate të ndryshme të metodës së propozuar. Shkencëtarët që punojnë pjesërisht për industrinë përpiqen ta marrin parasysh këtë dhe ndonjëherë futin klauzola të tilla si "në të dhënat tona rezultati është i tillë dhe ai, por në grupin e të dhënave publike - ashtu dhe ashtu".

Ndodh që metoda e propozuar është "përshtatur" plotësisht në një bazë të dhënash të hapur dhe nuk funksionon në të dhëna reale. Ju mund ta luftoni këtë problem të zakonshëm duke hapur grupe të dhënash të reja, më përfaqësuese, por shpesh ne po flasim për përmbajtje private që kompanitë thjesht nuk kanë të drejtë t'i hapin. Në disa raste, ata kryejnë anonimizim (ndonjëherë kompleks dhe të mundimshëm) të të dhënave - ata heqin çdo fragment që tregon një person specifik. Për shembull, fytyrat dhe numrat në fotografi fshihen ose bëhen të palexueshëm. Për më tepër, në mënyrë që grupi i të dhënave jo vetëm të jetë i disponueshëm për të gjithë, por të bëhet një standard midis shkencëtarëve mbi të cilin është i përshtatshëm për të krahasuar idetë, është e nevojshme jo vetëm ta publikoni atë, por edhe të shkruani një artikull të veçantë të cituar rreth atë dhe avantazhet e tij.

Është më keq kur nuk ka grupe të dhënash të hapura në temën që studiohet. Atëherë recensuesi mund të pranojë vetëm rezultatet e paraqitura nga autori mbi besimin. Teorikisht, autori madje mund t'i mbivlerësojë ato dhe të mbetet i pazbuluar, por në një mjedis akademik kjo nuk ka gjasa, pasi bie ndesh me dëshirën e shumicës dërrmuese të shkencëtarëve për të zhvilluar shkencën.

Në një numër fushash të ML, duke përfshirë vizionin kompjuterik, është gjithashtu e zakonshme të bashkëngjitni lidhje me kodin (zakonisht në GitHub) me artikuj. Vetë artikujt ose përmbajnë shumë pak kod ose janë pseudokod. Dhe këtu, përsëri, lindin vështirësi nëse artikulli është shkruar nga një studiues i një kompanie, dhe jo nga një universitet. Si parazgjedhje, kodi i shkruar në një korporatë ose startup emërtohet NDA. Studiuesit dhe kolegët e tyre duhet të punojnë shumë për të ndarë kodin që lidhet me idenë që përshkruhet nga depot e brendshme dhe sigurisht të mbyllura.

Mundësia e publikimit varet gjithashtu nga rëndësia e temës së zgjedhur. Rëndësia diktohet kryesisht nga produktet dhe shërbimet: nëse një korporatë ose startup është e interesuar të ndërtojë një shërbim të ri ose të përmirësojë një ekzistues bazuar në një ide nga një artikull, kjo është një plus.

Çmimi me emrin Ilya Segalovich. Një histori rreth shkencës kompjuterike dhe publikimeve të lançimit

Siç është përmendur tashmë, punimet e shkencave kompjuterike rrallë shkruhen vetëm. Por si rregull, njëri nga autorët shpenzon shumë më tepër kohë dhe përpjekje se të tjerët. Kontributi i tij në risitë shkencore është më i madhi. Në listën e autorëve, një person i tillë tregohet së pari - dhe në të ardhmen, kur i referohen një artikulli, ata mund ta përmendin vetëm atë (për shembull, "Ivanov et al" - "Ivanov dhe të tjerët" përkthyer nga latinishtja). Megjithatë, kontributet e të tjerëve janë gjithashtu jashtëzakonisht të vlefshme – përndryshe është e pamundur të jesh në listën e autorëve.

Procesi i rishikimit

Punimet zakonisht ndalojnë së pranuari disa muaj përpara konferencës. Pas dorëzimit të një artikulli, rishikuesit kanë 3-5 javë për ta lexuar, vlerësuar dhe komentuar atë. Kjo ndodh sipas sistemit single blind, kur autorët nuk i shohin emrat e recensentëve, ose double blind, kur vetë recensentët nuk i shohin emrat e autorëve. Opsioni i dytë konsiderohet më i paanshëm: disa punime shkencore kanë treguar se popullariteti i autorit ndikon në vendimin e recensuesit. Për shembull, ai mund të konsiderojë se një shkencëtar me një numër të madh artikujsh të botuar tashmë është a priori i denjë për një vlerësim më të lartë.

Për më tepër, edhe në rastin e dyfishtë të verbër, recensenti ndoshta do ta hamendësojë autorin nëse ata punojnë në të njëjtën fushë. Përveç kësaj, në kohën e rishikimit, artikulli mund të publikohet tashmë në bazën e të dhënave arXiv, depoja më e madhe e punimeve shkencore. Organizatorët e konferencës nuk e ndalojnë këtë, por rekomandojnë përdorimin e një titulli të ndryshëm dhe një abstrakt tjetër në botimet për arXiv. Por nëse artikulli është postuar atje, gjithsesi nuk do të jetë e vështirë ta gjesh atë.

Gjithmonë ka disa recensues që vlerësojnë një artikull. Njërit prej tyre i është caktuar roli i metarecensentit, i cili duhet vetëm të shqyrtojë vendimet e kolegëve të tij dhe të marrë vendimin përfundimtar. Nëse recensentët nuk pajtohen me artikullin, meta-recensues mund ta lexojë gjithashtu për plotësi.

Ndonjëherë, pas shqyrtimit të vlerësimit dhe komenteve, autori ka mundësinë të hyjë në një diskutim me recensuesin; madje ka një shans për ta bindur atë të ndryshojë vendimin e tij (megjithatë, një sistem i tillë nuk funksionon për të gjitha konferencat, dhe është edhe më pak e mundur të ndikohet seriozisht në vendim). Në diskutim nuk mund t'i referoheni punimeve të tjera shkencore, me përjashtim të atyre të përmendura tashmë në artikull. Ju vetëm mund të "ndihmoni" recensuesin të kuptojë më mirë përmbajtjen e artikullit.

Çmimi me emrin Ilya Segalovich. Një histori rreth shkencës kompjuterike dhe publikimeve të lançimit

Konferenca dhe revista

Artikujt e shkencave kompjuterike dërgohen më shpesh në konferenca sesa në revista shkencore. Kjo për shkak se botimet e revistave kanë kërkesa që janë më të vështira për t'u përmbushur dhe procesi i rishikimit nga kolegët mund të zgjasë muaj apo edhe vite. Shkenca kompjuterike është një fushë shumë e shpejtë, kështu që autorët zakonisht nuk janë të gatshëm të presin kaq gjatë për botim. Megjithatë, një artikull që tashmë është pranuar për konferencë mund të plotësohet (për shembull, duke paraqitur rezultate më të detajuara) dhe të botohet në një revistë ku kufizimet e hapësirës nuk janë aq të rrepta.

Ngjarjet në konferencë

Formati për praninë e autorëve të artikujve të miratuar në konferencë përcaktohet nga recensentët. Nëse artikullit i jepet drita jeshile, atëherë më së shpeshti ju caktohet një poster. Një poster është një rrëshqitje statike me një përmbledhje të artikullit dhe ilustrime. Disa salla konferencash janë të mbushura me rreshta të gjatë posterësh. Autori kalon një pjesë të konsiderueshme të kohës pranë posterit të tij, duke komunikuar me shkencëtarët që janë të interesuar për artikullin.

Çmimi me emrin Ilya Segalovich. Një histori rreth shkencës kompjuterike dhe publikimeve të lançimit

Çmimi me emrin Ilya Segalovich. Një histori rreth shkencës kompjuterike dhe publikimeve të lançimit

Një opsion pak më prestigjioz për pjesëmarrje është një bisedë rrufe. Nëse recensuesit e konsiderojnë artikullin të denjë për një raport të shpejtë, autorit i jepen rreth tre minuta për të folur me një audiencë të gjerë. Nga njëra anë, një bisedë rrufe është një mundësi e mirë për të treguar për idenë tuaj jo vetëm atyre që u interesuan për posterin me iniciativën e tyre. Nga ana tjetër, vizitorët proaktivë të posterit janë më të përgatitur dhe më të zhytur në temën tuaj specifike sesa dëgjuesi mesatar në sallë. Prandaj, në një raport të shpejtë, duhet të keni ende kohë për t'i përditësuar njerëzit.

Çmimi me emrin Ilya Segalovich. Një histori rreth shkencës kompjuterike dhe publikimeve të lançimit

Zakonisht, në fund të fjalimit të tyre të rrufeshëm, autorët emërtojnë numrin e posterit në mënyrë që dëgjuesit ta gjejnë atë dhe ta kuptojnë më mirë artikullin.

Çmimi me emrin Ilya Segalovich. Një histori rreth shkencës kompjuterike dhe publikimeve të lançimit

Opsioni i fundit, më prestigjioz është një poster plus një prezantim i plotë i idesë, kur nuk ka më nevojë të nxitoni për të treguar historinë.

Çmimi me emrin Ilya Segalovich. Një histori rreth shkencës kompjuterike dhe publikimeve të lançimit

Por sigurisht, shkencëtarët - përfshirë autorët e artikujve të miratuar - vijnë në konferencën e ardhshme jo vetëm për t'u dukur. Së pari, ata priren të gjejnë postera që lidhen me fushën e tyre për arsye të dukshme. Dhe së dyti, është e rëndësishme që ata të zgjerojnë listën e kontakteve me qëllim të punës së përbashkët akademike në të ardhmen. Kjo nuk është gjueti - ose, të paktën, faza e parë e saj, e cila të paktën pasohet nga një shkëmbim reciprokisht i dobishëm idesh, zhvillimesh dhe punë të përbashkët për një ose më shumë artikuj.

Në të njëjtën kohë, rrjetëzimi produktiv në një konferencë të lartë është i vështirë për shkak të mungesës totale të kohës së lirë. Nëse, pas një dite të tërë të kaluar në prezantime dhe në diskutime në postera, shkencëtari ka ruajtur forcën e tij dhe tashmë ka kapërcyer jet lag, atëherë ai shkon në një nga festat e shumta. Ato priten nga korporatat - si rezultat, partitë shpesh kanë një karakter më gjuetie. Në të njëjtën kohë, shumë të ftuar nuk i përdorin fare për të gjetur një punë të re, por, përsëri, për rrjetëzim. Në mbrëmje nuk ka më raporte dhe postera - është më e lehtë të "kapësh" specialistin që të intereson.

Çmimi me emrin Ilya Segalovich. Një histori rreth shkencës kompjuterike dhe publikimeve të lançimit

Nga ideja në prodhim

Shkenca kompjuterike është një nga industritë e pakta ku interesat e korporatave dhe startup-eve janë të lidhura fort me mjedisin akademik. NIPS, ICML dhe konferenca të tjera të ngjashme tërheqin shumë njerëz nga industria, jo vetëm nga universitetet. Kjo është tipike për fushën e shkencave kompjuterike, por anasjelltas për shumicën e shkencave të tjera.

Nga ana tjetër, jo të gjitha idetë e paraqitura në artikuj shkojnë menjëherë drejt krijimit ose përmirësimit të shërbimeve. Edhe brenda një kompanie, një studiues mund t'u propozojë kolegëve nga shërbimi një ide që është përparimtare sipas standardeve shkencore dhe të marrë një refuzim për ta zbatuar atë për një sërë arsyesh. Njëri prej tyre është përmendur tashmë këtu - ky është ndryshimi midis grupit të të dhënave "akademike" mbi të cilën është shkruar artikulli dhe grupit të të dhënave reale. Për më tepër, zbatimi i një ideje mund të vonohet, të kërkojë një sasi të madhe burimesh ose të përmirësojë vetëm një tregues me koston e përkeqësimit të treguesve të tjerë.

Çmimi me emrin Ilya Segalovich. Një histori rreth shkencës kompjuterike dhe publikimeve të lançimit

Situata shpëtohet nga fakti se shumë zhvillues vetë janë pak studiues. Ata marrin pjesë në konferenca, flasin të njëjtën gjuhë me akademikët, propozojnë ide, ndonjëherë marrin pjesë në krijimin e artikujve (për shembull, shkrimi i kodit), ose madje veprojnë si autorë vetë. Nëse një zhvillues është i zhytur në procesin akademik, ndjek atë që po ndodh në departamentin e kërkimit, me një fjalë - nëse demonstron një kundër-lëvizje ndaj shkencëtarëve, atëherë cikli i shndërrimit të ideve shkencore në aftësi të reja shërbimi shkurtohet.

Të gjithë studiuesve të rinj ju urojmë fat dhe arritje të mëdha në punën e tyre. Nëse ky postim nuk ju tha asgjë të re, atëherë mund ta keni publikuar tashmë në një konferencë të lartë. Regjistrohu për premium veten dhe emëroni mbikëqyrës shkencorë.

Burimi: www.habr.com

Shto një koment