Prize nga ginganlan sunod sa Ilya Segalovich. Usa ka istorya bahin sa siyensya sa kompyuter ug paglansad sa mga publikasyon

Prize nga ginganlan sunod sa Ilya Segalovich. Usa ka istorya bahin sa siyensya sa kompyuter ug paglansad sa mga publikasyon

Karon naglansad kami usa ka award sa siyensya nga ginganlag Ilya Segalovich iseg. Ihatag kini alang sa mga nahimo sa natad sa computer science. Undergraduate ug postgraduate nga mga estudyante mahimong mosumite sa ilang kaugalingon nga aplikasyon alang sa award o pag-nominate og mga siyentipikong superbisor. Ang mga mananaog pilion sa mga representante sa academic community ug Yandex. Ang nag-unang criteria sa pagpili: mga publikasyon ug mga presentasyon sa mga komperensya, ingon man ang kontribusyon sa pagpalambo sa komunidad.

Ang unang seremonyas sa award mahitabo sa Abril. Isip kabahin sa award, ang mga batan-ong siyentista makadawat og 350 ka libo nga mga rubles, ug dugang pa, sila makaadto sa usa ka internasyonal nga komperensya, magtrabaho kauban ang usa ka magtutudlo ug moagi sa internship sa departamento sa panukiduki sa Yandex. Ang mga superbisor sa siyensya makadawat og 700 ka libo nga mga rubles.

Sa okasyon sa paglusad sa award, nakahukom kami nga makig-istorya dinhi sa HabrΓ© mahitungod sa mga criteria alang sa kalampusan sa kalibutan sa computer science. Ang ubang mga magbabasa sa Habr pamilyar na sa kini nga mga pamatasan, samtang ang uban tingali adunay sayup nga impresyon bahin kanila. Karon atong taytayan kini nga kal-ang - atong hikapon ang tanan nga nag-unang mga hilisgutan, lakip ang mga artikulo, komperensya, mga datos ug ang pagbalhin sa mga ideya sa siyensya sa mga serbisyo.

Alang sa mga siyentipiko sa natad sa siyensya sa kompyuter, ang panguna nga sukdanan sa kalampusan mao ang pagmantala sa ilang siyentipikong buhat sa usa sa mga nanguna nga internasyonal nga komperensya. Kini ang unang "checkpoint" alang sa pag-ila sa trabaho sa tigdukiduki. Pananglitan, sa natad sa pagkat-on sa makina sa kinatibuk-an, ang International Conference on Machine Learning (ICML) ug ang Conference on Neural Information Processing Systems (NeurIPS, kanhi NIPS) gipalahi. Adunay daghang mga komperensya sa piho nga mga bahin sa ML, sama sa panan-awon sa kompyuter, pagkuha sa kasayuran, teknolohiya sa pagsulti, paghubad sa makina, ug uban pa.

Nganong imantala ang imong mga ideya

Ang mga tawo nga layo sa siyensya sa kompyuter tingali adunay sayop nga pagsabut nga mas maayo nga itago ang labing bililhon nga mga ideya ug maningkamot nga makaganansya gikan sa ilang pagkatalagsaon. Apan, ang tinuod nga kahimtang sa atong natad mao gayud ang sukwahi. Ang awtoridad sa usa ka siyentista gihukman pinaagi sa kamahinungdanon sa iyang mga buhat, kung unsa ka subsob ang iyang mga artikulo gikutlo sa ubang mga siyentipiko (citation index). Kini usa ka importante nga kinaiya sa iyang karera. Ang usa ka tigdukiduki nag-uswag sa propesyonal nga hagdanan, nga mahimong mas respetado sa iyang komunidad, kung siya kanunay nga nagpatunghag lig-on nga trabaho nga gipatik, nahimong bantogan, ug nahimong sukaranan sa buhat sa ubang mga siyentipiko.

Daghang nag-unang mga artikulo (tingali kadaghanan) ang resulta sa kolaborasyon tali sa mga tigdukiduki sa lain-laing unibersidad ug kompanya sa tibuok kalibotan. Ang usa ka importante ug bililhon kaayo nga higayon sa karera sa usa ka tigdukiduki mao ang higayon nga siya makakita ug mag-ilis sa mga ideya sa iyang kaugalingon base sa iyang kasinatian - apan bisan pa niini, ang iyang mga kauban nagpadayon sa paghatag kaniya og bililhong tabang. Ang mga siyentista nagtinabangay sa usag usa sa pagpalambo sa mga ideya, pagsulat sa mga artikulo nga magtinabangay - ug ang labi ka dako nga kontribusyon sa siyentista sa siyensya, labi ka dali alang kaniya ang pagpangita sa mga tawo nga parehas sa hunahuna.

Sa kataposan, ang densidad ug pagkaanaa sa impormasyon dako na kaayo karon nga ang lainlaing mga tigdukiduki dungan nga nakamugna ug susama kaayo (ug tinuod nga bililhon) nga mga ideya sa siyensya. Kung dili nimo imantala ang imong ideya, hapit na gyud nga lain ang magmantala niini para kanimo. Ang "nagdaog" sa kasagaran dili ang usa nga naghimo sa kabag-ohan sa usa ka gamay nga sayo pa, apan ang usa nga nagpatik niini sa sayo pa. O - ang usa nga nakahimo sa pagpadayag sa ideya sa hingpit, tin-aw ug makapakombinsir kutob sa mahimo.

Prize nga ginganlan sunod sa Ilya Segalovich. Usa ka istorya bahin sa siyensya sa kompyuter ug paglansad sa mga publikasyon

Mga artikulo ug mga datos

Busa, usa ka siyentipikong artikulo ang gitukod palibot sa pangunang ideya nga gisugyot sa tigdukiduki. Kini nga ideya mao ang iyang kontribusyon sa computer science. Ang artikulo nagsugod sa usa ka paghulagway sa ideya, giporma sa pipila ka mga tudling-pulong. Gisundan kini sa usa ka pasiuna nga naghulagway sa lain-laing mga problema nga nasulbad sa tabang sa gisugyot nga kabag-ohan. Ang deskripsyon ug introduksiyon sagad gisulat sa yanong pinulongan nga masabtan sa kadaghanan. Pagkahuman sa pasiuna, kinahanglan nga pormal ang mga problema nga gipresentar sa lengguwahe sa matematika ug ipaila ang estrikto nga notasyon. Dayon, gamit ang gipaila nga mga notasyon, kinahanglan nimo nga maghimo usa ka tin-aw ug komprehensibo nga pahayag sa esensya sa gisugyot nga kabag-ohan, ug mahibal-an ang mga kalainan gikan sa kaniadto, parehas nga mga pamaagi. Ang tanan nga teoretikal nga mga pahayag kinahanglan nga suportado sa mga pakisayran sa naipon nga ebidensya kaniadto, o napamatud-an nga independente. Mahimo kini nga buhaton uban ang pipila ka mga pangagpas. Pananglitan, makahatag ka og pruweba alang sa kaso kung adunay walay kinutuban nga gidaghanon sa datos sa pagbansay (usa ka klaro nga dili makab-ot nga sitwasyon) o sila hingpit nga independente sa usag usa. Sa katapusan sa artikulo, ang siyentista naghisgot bahin sa mga resulta sa eksperimento nga iyang nakuha.

Prize nga ginganlan sunod sa Ilya Segalovich. Usa ka istorya bahin sa siyensya sa kompyuter ug paglansad sa mga publikasyon

Aron ang mga tigrepaso nga gi-recruit sa mga tig-organisar sa komperensya mas lagmit nga aprobahan ang usa ka papel, kini kinahanglan nga adunay usa o daghang mga hiyas. Usa ka mahinungdanong butang nga makadugang sa kahigayonan sa pag-uyon mao ang siyentipikanhong kabag-ohan sa gisugyot nga ideya. Kasagaran, ang kabag-ohan gisusi kalabot sa naa na nga mga ideya - ug ang buluhaton sa pagtimbang-timbang niini wala gihimo sa tigrepaso, apan sa tagsulat mismo sa artikulo. Sa tinuud, ang tagsulat kinahanglan nga isulti sa detalye sa artikulo bahin sa mga naglungtad nga mga pamaagi ug, kung mahimo, ipresentar sila ingon mga espesyal nga kaso sa iyang pamaagi. Sa ingon, gipakita sa siyentista nga ang gidawat nga mga pamaagi dili kanunay molihok, nga iyang gi-generalize kini ug gisugyot ang usa ka labi ka lapad, labi ka dali ug busa labi ka epektibo nga pagporma sa teoretikal. Kung ang kabag-ohan dili ikalimod, kung dili, ang mga tigrepaso magtimbang-timbang sa artikulo nga dili kaayo pilion - pananglitan, mahimo silang magpakabuta sa dili maayo nga English.

Aron mapalig-on ang kabag-ohan, mapuslanon ang paglakip sa pagtandi sa kasamtangan nga mga pamaagi sa usa o daghan pa nga mga dataset. Ang matag usa kanila kinahanglan nga bukas ug dawaton sa akademikong palibot. Pananglitan, adunay ImageNet image repository ug mga database sa maong mga institute sama sa Modified National Institute of Standards and Technology (MNIST) ug CIFAR (Canadian Institute For Advanced Research). Ang kalisud mao nga ang ingon nga usa ka "akademiko" nga dataset kanunay nga lahi sa istruktura sa sulud gikan sa tinuud nga datos nga giatubang sa industriya. Nagkalainlain nga datos nagpasabut nga lahi nga mga sangputanan sa gisugyot nga pamaagi. Ang mga siyentipiko nga adunay bahin nga nagtrabaho alang sa industriya naningkamot nga tagdon kini ug usahay magsal-ot sa mga disclaimer sama sa "sa among data ang resulta mao ug ingon niana, apan sa publiko nga dataset - ingon ug ingon niana."

Nahitabo nga ang gisugyot nga pamaagi hingpit nga "gipahaum" sa usa ka bukas nga database ug wala molihok sa tinuud nga datos. Mahimo nimong mabuntog kini nga kasagarang problema pinaagi sa pag-abli sa bag-o, mas daghang representante nga mga dataset, apan kanunay nga naghisgot kami bahin sa pribado nga sulud nga ang mga kompanya wala’y katungod sa pag-abli. Sa pipila ka mga kaso, ilang gihimo (usahay komplikado ug makuti nga) anonymization sa datos - ilang gikuha ang bisan unsang mga tipik nga nagpunting sa usa ka piho nga tawo. Pananglitan, ang mga nawong ug numero sa mga litrato gipapas o gihimong dili mabasa. Dugang pa, aron ang dataset dili lamang magamit sa tanan, apan mahimong usa ka sumbanan sa mga siyentipiko diin kini sayon ​​​​sa pagtandi sa mga ideya, gikinahanglan dili lamang sa pagmantala niini, kondili sa pagsulat usab sa usa ka linain nga gikutlo nga artikulo mahitungod sa kini ug ang mga bentaha niini.

Mas grabe kung walay bukas nga mga dataset sa hilisgutan nga gitun-an. Unya ang tigrepaso makadawat lamang sa mga resulta nga gipresentar sa tagsulat bahin sa pagtuo. Sa teoriya, ang tagsulat mahimo pa gani nga magpasobra sa ilang gibug-aton ug magpabilin nga dili makit-an, apan sa usa ka akademikong palibot kini dili mahimo, tungod kay kini supak sa tinguha sa kadaghanan sa mga siyentipiko sa pagpalambo sa siyensiya.

Sa ubay-ubay nga mga bahin sa ML, lakip ang computer vision, kasagaran usab ang pag-attach sa mga link sa code (kasagaran sa GitHub) nga adunay mga artikulo. Ang mga artikulo mismo adunay gamay nga code o pseudocode. Ug dinhi, pag-usab, ang mga kalisdanan mitungha kung ang artikulo gisulat sa usa ka tigdukiduki gikan sa usa ka kompanya, ug dili gikan sa usa ka unibersidad. Sa kasagaran, ang code nga gisulat sa usa ka korporasyon o startup gimarkahan nga NDA. Ang mga tigdukiduki ug ilang mga kauban kinahanglan nga magtrabaho pag-ayo sa pagbulag sa code nga may kalabutan sa ideya nga gihulagway gikan sa internal ug siguradong sirado nga mga repositoryo.

Ang kahigayonan sa pagmantala nagdepende usab sa kalambigitan sa gipili nga topiko. Ang kalambigitan kadaghanan gidiktar sa mga produkto ug serbisyo: kung ang usa ka korporasyon o pagsugod interesado sa pagtukod og bag-ong serbisyo o pagpaayo sa usa nga naglungtad base sa usa ka ideya gikan sa usa ka artikulo, kana usa ka dugang.

Prize nga ginganlan sunod sa Ilya Segalovich. Usa ka istorya bahin sa siyensya sa kompyuter ug paglansad sa mga publikasyon

Sama sa nahisgotan na, ang mga papel sa siyensya sa kompyuter panagsa ra nga gisulat nga nag-inusara. Apan ingon nga usa ka lagda, ang usa sa mga tagsulat naggugol ug daghang oras ug paningkamot kaysa sa uban. Ang iyang kontribusyon sa kabag-ohan sa siyensya mao ang pinakadako. Sa lista sa mga tagsulat, ang ingon nga tawo gipakita una - ug sa umaabot, kung maghisgot sa usa ka artikulo, mahimo ra nila siya hisgutan (pananglitan, "Ivanov et al" - "Ivanov ug uban pa" gihubad gikan sa Latin). Bisan pa, ang mga kontribusyon sa uban labi ka bililhon - kung dili imposible nga maapil sa lista sa mga tagsulat.

Proseso sa pagsusi

Ang mga papel kasagaran mohunong sa pagdawat pipila ka bulan sa wala pa ang komperensya. Human masumiter ang usa ka artikulo, ang mga tigrepaso adunay 3–5 ka semana sa pagbasa, pagtimbang-timbang, ug pagkomento niini. Kini mahitabo sumala sa single blind nga sistema, sa diha nga ang mga tagsulat dili makakita sa mga ngalan sa mga reviewer, o ang double blind, sa diha nga ang mga reviewer sa ilang kaugalingon dili makakita sa mga ngalan sa mga tagsulat. Ang ikaduhang opsyon gikonsiderar nga mas walay pagpihig: ubay-ubay nga siyentipikong mga papel ang nagpakita nga ang pagkapopular sa tagsulat nakaimpluwensya sa desisyon sa tigrepaso. Pananglitan, mahimo niyang hunahunaon nga ang usa ka siyentipiko nga adunay daghang namantala nga mga artikulo usa ka priori nga takus sa usa ka mas taas nga rating.

Dugang pa, bisan sa kaso sa double blind, ang tigrepaso lagmit makatag-an sa tagsulat kon sila nagtrabaho sa samang natad. Dugang pa, sa panahon sa pagrepaso, ang artikulo mahimong mamantala na sa arXiv database, ang kinadak-ang tipiganan sa siyentipikong mga papeles. Ang mga nag-organisar sa komperensya wala magdili niini, apan ilang girekomenda ang paggamit sa usa ka lahi nga titulo ug usa ka lahi nga abstract sa mga publikasyon alang sa arXiv. Apan kung ang artikulo gibutang didto, dili gihapon lisud ang pagpangita niini.

Kanunay adunay daghang mga tigsusi nga nagtimbangtimbang sa usa ka artikulo. Ang usa kanila gitahasan sa tahas sa meta-reviewer, kinsa kinahanglan lamang nga magrepaso sa mga hukom sa iyang mga kauban ug mohimo sa katapusang desisyon. Kung ang mga tigrepaso dili mouyon sa artikulo, ang meta-reviewer mahimo usab nga magbasa niini alang sa pagkakompleto.

Usahay, human sa pagrepaso sa rating ug mga komentaryo, ang tagsulat adunay oportunidad sa pagsulod sa usa ka diskusyon uban sa reviewer; adunay bisan usa ka higayon nga makombinsir siya sa pagbag-o sa iyang desisyon (bisan pa, ang ingon nga sistema dili molihok alang sa tanan nga mga komperensya, ug dili kaayo posible nga seryoso nga maimpluwensyahan ang hukom). Sa diskusyon, dili ka mahimong maghisgot sa ubang mga buhat sa siyensya, gawas sa mga nahisgotan na sa artikulo. Makatabang ka lang sa tigrepaso nga mas masabtan ang sulod sa artikulo.

Prize nga ginganlan sunod sa Ilya Segalovich. Usa ka istorya bahin sa siyensya sa kompyuter ug paglansad sa mga publikasyon

Mga komperensya ug mga journal

Ang mga artikulo sa siyensya sa kompyuter mas kanunay nga gisumite sa mga komperensya kaysa sa mga journal sa siyensya. Kini tungod kay ang mga publikasyon sa journal adunay mga kinahanglanon nga mas lisud nga matuman, ug ang proseso sa pagrepaso sa kaubanan mahimong mokabat ug mga bulan o bisan mga tuig. Ang siyensya sa kompyuter usa ka paspas kaayo nga natad, busa ang mga tagsulat kasagaran dili andam nga maghulat nga dugay alang sa publikasyon. Bisan pa, ang usa ka artikulo nga gidawat na alang sa komperensya mahimo nga madugangan (pananglitan, pinaagi sa pagpresentar sa mas detalyado nga mga resulta) ug gipatik sa usa ka journal diin ang mga pagdili sa wanang dili kaayo estrikto.

Mga panghitabo sa komperensya

Ang pormat alang sa presensya sa mga tagsulat sa giaprobahan nga mga artikulo sa komperensya gitino sa mga tigrepaso. Kung ang artikulo gihatagan og berde nga suga, nan kanunay ka nga gigahin usa ka poster stand. Ang poster usa ka static nga slide nga adunay summary sa artikulo ug mga ilustrasyon. Ang ubang mga conference room napuno sa tag-as nga mga laray sa poster stand. Ang tagsulat naggugol sa usa ka hinungdanon nga bahin sa iyang oras duol sa iyang poster, nakigsulti sa mga siyentipiko nga interesado sa artikulo.

Prize nga ginganlan sunod sa Ilya Segalovich. Usa ka istorya bahin sa siyensya sa kompyuter ug paglansad sa mga publikasyon

Prize nga ginganlan sunod sa Ilya Segalovich. Usa ka istorya bahin sa siyensya sa kompyuter ug paglansad sa mga publikasyon

Ang usa ka gamay nga mas prestihiyosong kapilian alang sa pag-apil mao ang usa ka kilat nga pakigpulong. Kung gikonsiderar sa mga tigrepaso ang artikulo nga takus sa usa ka dali nga taho, ang tagsulat gihatagan mga tulo ka minuto aron makigsulti sa daghang mamiminaw. Sa usa ka bahin, ang usa ka kilat nga pakigpulong usa ka maayong oportunidad sa pagsulti bahin sa imong ideya dili lamang sa mga interesado sa poster sa ilang kaugalingon nga inisyatiba. Sa laing bahin, ang mga proactive poster nga mga bisita mas andam ug mas naunlod sa imong espesipikong hilisgutan kay sa kasagaran nga tigpaminaw sa hawanan. Busa, sa usa ka dali nga taho, kinahanglan pa nimo nga adunay panahon aron madala ang mga tawo hangtod karon.

Prize nga ginganlan sunod sa Ilya Segalovich. Usa ka istorya bahin sa siyensya sa kompyuter ug paglansad sa mga publikasyon

Kasagaran, sa katapusan sa ilang kilat nga pakigpulong, ang mga awtor nagngalan sa numero sa poster aron ang mga tigpaminaw makit-an kini ug mas masabtan ang artikulo.

Prize nga ginganlan sunod sa Ilya Segalovich. Usa ka istorya bahin sa siyensya sa kompyuter ug paglansad sa mga publikasyon

Ang katapusan, labing inila nga kapilian mao ang usa ka poster ug usa ka hingpit nga presentasyon sa ideya, kung wala na kinahanglana nga magdali aron isulti ang istorya.

Prize nga ginganlan sunod sa Ilya Segalovich. Usa ka istorya bahin sa siyensya sa kompyuter ug paglansad sa mga publikasyon

Apan siyempre, ang mga siyentipiko - lakip ang mga tagsulat sa gi-aprubahan nga mga artikulo - moabut sa sunod nga komperensya dili lamang aron ipakita. Una, lagmit mangita silag mga poster nga may kalabotan sa ilang natad alang sa klaro nga mga hinungdan. Ug ikaduha, importante alang kanila ang pagpalapad sa ilang listahan sa mga kontak alang sa katuyoan sa hiniusang akademikong trabaho sa umaabot. Dili kini pagpangayam - o, labing menos, ang una nga yugto niini, nga labing menos gisundan sa usa ka mapuslanon nga pagbinayloay sa mga ideya, kalamboan ug hiniusang trabaho sa usa o daghang mga artikulo.

Sa parehas nga oras, ang produktibo nga networking sa usa ka taas nga komperensya lisud tungod sa kakulang sa libre nga oras. Kung, human sa tibuok adlaw nga gigugol sa mga presentasyon ug sa mga diskusyon sa mga poster, ang siyentista nagpabilin sa iyang kusog ug nakabuntog na sa jet lag, nan siya moadto sa usa sa daghang mga partido. Gi-host sila sa mga korporasyon - ingon usa ka sangputanan, ang mga partido kanunay adunay usa ka labi nga kinaiya sa pagpangayam. Sa samang higayon, daghang mga bisita ang naggamit niini dili sa pagpangita og bag-ong trabaho, apan, pag-usab, alang sa networking. Sa gabii wala nay mga taho ug mga poster - mas sayon ​​​​ang "pagdakop" sa espesyalista nga imong gusto.

Prize nga ginganlan sunod sa Ilya Segalovich. Usa ka istorya bahin sa siyensya sa kompyuter ug paglansad sa mga publikasyon

Gikan sa ideya hangtod sa produksiyon

Ang siyensya sa kompyuter usa sa pipila nga mga industriya diin ang mga interes sa mga korporasyon ug mga startup kusganong nalambigit sa akademikong palibot. Ang NIPS, ICML ug uban pang susama nga mga komperensya nakadani sa daghang mga tawo gikan sa industriya, dili lamang sa mga unibersidad. Kini kasagaran alang sa natad sa computer science, apan vice versa alang sa kadaghanan sa ubang mga siyensya.

Sa laing bahin, dili tanan nga mga ideya nga gipresentar sa mga artikulo moadto dayon sa paghimo o pagpaayo sa mga serbisyo. Bisan sa sulod sa usa ka kompanya, ang usa ka tigdukiduki mahimo nga mosugyot sa mga kauban gikan sa serbisyo sa usa ka ideya nga nakab-ot sa mga sukaranan sa siyensya ug makadawat usa ka pagdumili sa pagpatuman niini tungod sa daghang mga hinungdan. Ang usa niini nahisgutan na dinhi - kini ang kalainan tali sa "akademiko" nga set sa datos diin gisulat ang artikulo ug ang tinuod nga set sa datos. Dugang pa, ang pagpatuman sa usa ka ideya mahimong malangan, nanginahanglan ug daghang mga kahinguhaan, o pagpauswag lamang sa usa ka timailhan sa gasto sa pagkadaot sa ubang mga sukatan.

Prize nga ginganlan sunod sa Ilya Segalovich. Usa ka istorya bahin sa siyensya sa kompyuter ug paglansad sa mga publikasyon

Ang sitwasyon naluwas sa kamatuoran nga daghang mga developers sa ilang kaugalingon mao ang usa ka gamay nga tigdukiduki. Nagtambong sila sa mga komperensya, nagsulti sa parehas nga sinultian sa mga akademiko, nagsugyot og mga ideya, usahay nag-apil sa paghimo sa mga artikulo (pananglitan, pagsulat sa code), o bisan sa paglihok ingon mga tagsulat mismo. Kung ang usa ka developer naunlod sa proseso sa akademiko, nagsunod sa kung unsa ang nahitabo sa departamento sa panukiduki, sa usa ka pulong - kung gipakita niya ang usa ka kontra-lihok sa mga siyentista, nan ang siklo sa paghimo sa mga ideya sa siyensya sa bag-ong mga kapabilidad sa serbisyo gipamubu.

Nanghinaut kami nga ang tanan nga mga batan-on nga tigdukiduki maayong swerte ug daghang mga nahimo sa ilang trabaho. Kung kini nga post wala'y gisulti kanimo bisan unsa nga bag-o, nan mahimo nimong gipatik sa usa ka top conference. Register alang sa premium imong kaugalingon ug itudlo ang mga superbisor sa siyensya.

Source: www.habr.com

Idugang sa usa ka comment