Prize na pinangalanang Ilya Segalovich. Isang kwento tungkol sa computer science at paglulunsad ng mga publikasyon

Prize na pinangalanang Ilya Segalovich. Isang kwento tungkol sa computer science at paglulunsad ng mga publikasyon

Ngayon ay naglulunsad kami ng isang pang-agham na parangal na pinangalanang Ilya Segalovich iseg. Ito ay igagawad para sa mga tagumpay sa larangan ng computer science. Undergraduate at postgraduate na mga mag-aaral maaaring magsumite ng kanilang sariling aplikasyon para sa parangal o magmungkahi ng mga siyentipikong superbisor. Ang mga mananalo ay pipiliin ng mga kinatawan ng akademikong komunidad at Yandex. Ang pangunahing pamantayan sa pagpili: mga publikasyon at mga presentasyon sa mga kumperensya, pati na rin ang kontribusyon sa pag-unlad ng komunidad.

Ang unang seremonya ng parangal ay magaganap sa Abril. Bilang bahagi ng parangal, ang mga batang siyentipiko ay makakatanggap ng 350 libong rubles, at bilang karagdagan, maaari silang pumunta sa isang internasyonal na kumperensya, magtrabaho kasama ang isang tagapayo at sumailalim sa isang internship sa departamento ng pananaliksik ng Yandex. Ang mga siyentipikong superbisor ay makakatanggap ng 700 libong rubles.

Sa okasyon ng paglulunsad ng parangal, nagpasya kaming makipag-usap dito sa HabrΓ© tungkol sa pamantayan para sa tagumpay sa mundo ng computer science. Ang ilang mga mambabasa ng Habr ay pamilyar na sa mga pamantayang ito, habang ang iba ay maaaring magkaroon ng maling impresyon tungkol sa kanila. Ngayon ay tutulayin natin ang agwat na ito - tatalakayin natin ang lahat ng pangunahing paksa, kabilang ang mga artikulo, kumperensya, dataset at ang paglipat ng mga ideyang siyentipiko sa mga serbisyo.

Para sa mga siyentipiko sa larangan ng computer science, ang pangunahing criterion para sa tagumpay ay ang paglalathala ng kanilang gawaing siyentipiko sa isa sa mga nangungunang internasyonal na kumperensya. Ito ang unang "checkpoint" para sa pagkilala sa gawain ng mananaliksik. Halimbawa, sa larangan ng machine learning sa pangkalahatan, ang International Conference on Machine Learning (ICML) at ang Conference on Neural Information Processing Systems (NeurIPS, dating NIPS) ay nakikilala. Mayroong maraming mga kumperensya sa mga partikular na lugar ng ML, tulad ng computer vision, pagkuha ng impormasyon, teknolohiya sa pagsasalita, pagsasalin ng makina, atbp.

Bakit i-publish ang iyong mga ideya

Ang mga taong malayo sa computer science ay maaaring magkaroon ng maling kuru-kuro na mas mabuting panatilihing lihim ang pinakamahahalagang ideya at magsikap na kumita mula sa kanilang pagiging natatangi. Gayunpaman, ang totoong sitwasyon sa aming larangan ay eksaktong kabaligtaran. Ang awtoridad ng isang siyentipiko ay hinuhusgahan ng kahalagahan ng kanyang mga gawa, sa kung gaano kadalas binanggit ang kanyang mga artikulo ng ibang mga siyentipiko (citation index). Ito ay isang mahalagang katangian ng kanyang karera. Ang isang mananaliksik ay umaakyat sa propesyonal na hagdan, na nagiging mas iginagalang sa kanyang komunidad, kung siya ay patuloy na gumagawa ng matibay na akda na nai-publish, nagiging sikat, at nagiging batayan para sa gawain ng ibang mga siyentipiko.

Maraming nangungunang artikulo (marahil karamihan) ay resulta ng pakikipagtulungan sa pagitan ng mga mananaliksik sa iba't ibang unibersidad at kumpanya sa buong mundo. Ang isang mahalaga at napakahalagang sandali sa karera ng isang mananaliksik ay kapag nakakuha siya ng pagkakataong maghanap at magsala ng mga ideya sa kanyang sarili batay sa kanyang karanasan - ngunit kahit na pagkatapos nito, patuloy na binibigyan siya ng kanyang mga kasamahan ng napakahalagang tulong. Tinutulungan ng mga siyentipiko ang bawat isa na bumuo ng mga ideya, magsulat ng mga artikulo sa pakikipagtulungan - at kung mas malaki ang kontribusyon ng siyentipiko sa agham, mas madali para sa kanya na makahanap ng mga taong katulad ng pag-iisip.

Sa wakas, ang densidad at pagkakaroon ng impormasyon ay napakahusay na ngayon na ang iba't ibang mga mananaliksik ay sabay-sabay na nakabuo ng halos magkatulad (at tunay na mahalaga) mga ideyang siyentipiko. Kung hindi mo mai-publish ang iyong ideya, halos tiyak na iba ang mag-publish nito para sa iyo. Ang "nagwagi" ay madalas na hindi ang nag-isip ng pagbabago nang kaunti nang mas maaga, ngunit ang nag-publish nito nang mas maaga. O - ang isa na nagawang ihayag ang ideya nang buo, malinaw at nakakumbinsi hangga't maaari.

Prize na pinangalanang Ilya Segalovich. Isang kwento tungkol sa computer science at paglulunsad ng mga publikasyon

Mga artikulo at dataset

Kaya, ang isang siyentipikong artikulo ay binuo sa paligid ng pangunahing ideya na iminungkahi ng mananaliksik. Ang ideyang ito ay ang kanyang kontribusyon sa computer science. Ang artikulo ay nagsisimula sa isang paglalarawan ng ideya, na binuo sa ilang mga pangungusap. Sinusundan ito ng isang panimula na naglalarawan sa hanay ng mga problemang nalutas sa tulong ng iminungkahing pagbabago. Ang paglalarawan at pagpapakilala ay karaniwang nakasulat sa simpleng wika na naiintindihan ng malawak na madla. Pagkatapos ng pagpapakilala, kinakailangan na gawing pormal ang mga problema na ipinakita sa wikang matematika at ipakilala ang mahigpit na notasyon. Pagkatapos, gamit ang ipinakilala na mga notasyon, kailangan mong lumikha ng isang malinaw at komprehensibong pahayag ng kakanyahan ng iminungkahing pagbabago, at tukuyin ang mga pagkakaiba mula sa naunang, katulad na mga pamamaraan. Ang lahat ng teoretikal na pahayag ay dapat na suportado ng mga sanggunian sa dati nang pinagsama-samang ebidensya, o napatunayan nang nakapag-iisa. Ito ay maaaring gawin sa ilang mga pagpapalagay. Halimbawa, maaari kang magbigay ng patunay para sa kaso kapag mayroong walang katapusang dami ng data ng pagsasanay (isang malinaw na hindi matamo na sitwasyon) o ganap silang independyente sa isa't isa. Sa pagtatapos ng artikulo, pinag-uusapan ng siyentipiko ang tungkol sa mga pang-eksperimentong resulta na nakuha niya.

Prize na pinangalanang Ilya Segalovich. Isang kwento tungkol sa computer science at paglulunsad ng mga publikasyon

Upang ang mga reviewer na na-recruit ng mga organizer ng kumperensya ay mas malamang na aprubahan ang isang papel, dapat itong magkaroon ng isa o higit pang mga katangian. Ang isang pangunahing kadahilanan na nagpapataas ng mga pagkakataon ng pag-apruba ay ang siyentipikong bagong bagay ng iminungkahing ideya. Kadalasan, ang pagiging bago ay tinasa na may kaugnayan sa mga umiiral nang ideya - at ang gawain ng pagtatasa nito ay hindi isinasagawa ng tagasuri, ngunit ng may-akda mismo ng artikulo. Sa isip, dapat sabihin ng may-akda nang detalyado sa artikulo ang tungkol sa mga umiiral na pamamaraan at, kung maaari, ipakita ang mga ito bilang mga espesyal na kaso ng kanyang pamamaraan. Kaya, ipinakita ng siyentipiko na ang mga tinatanggap na diskarte ay hindi palaging gumagana, na siya ay pangkalahatan ang mga ito at nagmungkahi ng isang mas malawak, mas nababaluktot at samakatuwid ay mas epektibong teoretikal na pagbabalangkas. Kung hindi maikakaila ang pagiging bago, kung hindi, sinusuri ng mga tagasuri ang artikulo nang hindi masyadong mapili - halimbawa, maaari silang pumikit sa mahinang Ingles.

Upang palakasin ang pagiging bago, kapaki-pakinabang na magsama ng paghahambing sa mga kasalukuyang pamamaraan sa isa o higit pang mga dataset. Ang bawat isa sa kanila ay dapat na bukas at tinatanggap sa akademikong kapaligiran. Halimbawa, mayroong ImageNet image repository at mga database ng mga naturang institute gaya ng Modified National Institute of Standards and Technology (MNIST) at CIFAR (Canadian Institute For Advanced Research). Ang kahirapan ay ang ganitong "akademikong" dataset ay madalas na naiiba sa istraktura ng nilalaman mula sa totoong data na tinatalakay ng industriya. Ang iba't ibang data ay nangangahulugan ng iba't ibang resulta ng iminungkahing pamamaraan. Sinusubukan ng mga siyentipiko na bahagyang nagtatrabaho para sa industriya na isaalang-alang ito at kung minsan ay naglalagay ng mga sugnay tulad ng "sa aming data ang resulta ay ganito at ganoon, ngunit sa pampublikong dataset - ganito at ganoon."

Nangyayari na ang iminungkahing pamamaraan ay ganap na "iniayon" sa isang bukas na database at hindi gumagana sa totoong data. Maaari mong labanan ang karaniwang problemang ito sa pamamagitan ng pagbubukas ng mga bago, higit na kinatawan ng mga dataset, ngunit kadalasan ay pinag-uusapan natin ang tungkol sa pribadong nilalaman na ang mga kumpanya ay walang karapatang magbukas. Sa ilang mga kaso, nagsasagawa sila (kung minsan ay kumplikado at maingat) na anonymization ng data - inaalis nila ang anumang mga fragment na tumuturo sa isang partikular na tao. Halimbawa, ang mga mukha at numero sa mga litrato ay binubura o ginagawang hindi mabasa. Bilang karagdagan, upang ang dataset ay hindi lamang magagamit sa lahat, ngunit upang maging isang pamantayan sa mga siyentipiko kung saan ito ay maginhawa upang ihambing ang mga ideya, ito ay kinakailangan hindi lamang upang i-publish ito, ngunit din na magsulat ng isang hiwalay na binanggit na artikulo tungkol sa ito at ang mga pakinabang nito.

Mas malala kapag walang bukas na dataset sa paksang pinag-aaralan. Pagkatapos ay maaari lamang tanggapin ng tagasuri ang mga resulta na ipinakita ng may-akda sa pananampalataya. Sa teoryang, ang may-akda ay maaaring mag-overestimate sa kanila at manatiling hindi natukoy, ngunit sa isang akademikong kapaligiran ito ay hindi malamang, dahil ito ay sumasalungat sa pagnanais ng karamihan ng mga siyentipiko na bumuo ng agham.

Sa ilang bahagi ng ML, kabilang ang computer vision, karaniwan ding mag-attach ng mga link sa code (karaniwang sa GitHub) na may mga artikulo. Ang mga artikulo mismo ay naglalaman ng napakakaunting code o pseudocode. At dito, muli, ang mga paghihirap ay lumitaw kung ang artikulo ay isinulat ng isang mananaliksik mula sa isang kumpanya, at hindi mula sa isang unibersidad. Bilang default, ang code na nakasulat sa isang korporasyon o startup ay may label na NDA. Ang mga mananaliksik at kanilang mga kasamahan ay kailangang magtrabaho nang husto upang paghiwalayin ang code na nauugnay sa ideyang inilalarawan mula sa panloob at tiyak na mga saradong repositoryo.

Ang pagkakataon ng publikasyon ay nakasalalay din sa kaugnayan ng napiling paksa. Ang kaugnayan ay higit na idinidikta ng mga produkto at serbisyo: kung ang isang korporasyon o startup ay interesado sa pagbuo ng isang bagong serbisyo o pagpapabuti ng isang umiiral nang batay sa isang ideya mula sa isang artikulo, iyon ay isang plus.

Prize na pinangalanang Ilya Segalovich. Isang kwento tungkol sa computer science at paglulunsad ng mga publikasyon

Tulad ng nabanggit na, ang mga papel sa computer science ay bihirang isulat nang nag-iisa. Ngunit bilang panuntunan, ang isa sa mga may-akda ay gumugugol ng mas maraming oras at pagsisikap kaysa sa iba. Ang kanyang kontribusyon sa makabagong siyentipiko ay ang pinakadakila. Sa listahan ng mga may-akda, ang gayong tao ay unang ipinahiwatig - at sa hinaharap, kapag tumutukoy sa isang artikulo, maaari lamang nilang banggitin siya (halimbawa, "Ivanov et al" - "Ivanov at iba pa" na isinalin mula sa Latin). Gayunpaman, ang mga kontribusyon ng iba ay lubhang mahalaga - kung hindi, imposibleng mapabilang sa listahan ng mga may-akda.

Proseso ng pagsusuri

Karaniwang humihinto ang pagtanggap ng mga papel ilang buwan bago ang kumperensya. Pagkatapos maisumite ang isang artikulo, may 3–5 na linggo ang mga reviewer para basahin, suriin, at komento ito. Nangyayari ito ayon sa single blind system, kapag hindi nakita ng mga may-akda ang mga pangalan ng mga reviewer, o ang double blind, kapag ang mga reviewer mismo ay hindi nakikita ang mga pangalan ng mga may-akda. Ang pangalawang opsyon ay itinuturing na mas walang kinikilingan: ilang mga siyentipikong papel ang nagpakita na ang kasikatan ng may-akda ay nakakaimpluwensya sa desisyon ng tagasuri. Halimbawa, maaari niyang isaalang-alang na ang isang siyentipiko na may malaking bilang ng mga nai-publish na artikulo ay isang priori na karapat-dapat sa isang mas mataas na rating.

Bukod dito, kahit na sa kaso ng double blind, malamang na hulaan ng reviewer ang may-akda kung nagtatrabaho sila sa parehong larangan. Bilang karagdagan, sa oras ng pagsusuri, ang artikulo ay maaaring nai-publish na sa arXiv database, ang pinakamalaking repository ng mga siyentipikong papel. Hindi ito ipinagbabawal ng mga organizer ng kumperensya, ngunit inirerekomenda nila ang paggamit ng ibang pamagat at ibang abstract sa mga publikasyon para sa arXiv. Ngunit kung ang artikulo ay nai-post doon, hindi pa rin ito mahirap hanapin.

Palaging maraming tagasuri ang nagsusuri ng isang artikulo. Ang isa sa kanila ay itinalaga bilang meta-reviewer, na dapat lamang suriin ang mga hatol ng kanyang mga kasamahan at gawin ang pangwakas na desisyon. Kung hindi sumasang-ayon ang mga reviewer sa artikulo, maaari din itong basahin ng meta-reviewer para sa pagkakumpleto.

Minsan, pagkatapos suriin ang rating at komento, ang may-akda ay may pagkakataon na pumasok sa isang talakayan kasama ang tagasuri; may pagkakataon pa nga na kumbinsihin siya na baguhin ang kanyang desisyon (gayunpaman, ang ganitong sistema ay hindi gumagana para sa lahat ng mga kumperensya, at hindi gaanong posible na seryosong maimpluwensyahan ang hatol). Sa talakayan, hindi ka maaaring sumangguni sa iba pang mga akdang siyentipiko, maliban sa mga nabanggit na sa artikulo. Maaari mo lamang "tulungan" ang tagasuri na mas maunawaan ang nilalaman ng artikulo.

Prize na pinangalanang Ilya Segalovich. Isang kwento tungkol sa computer science at paglulunsad ng mga publikasyon

Mga kumperensya at journal

Ang mga artikulo sa computer science ay mas madalas na isinumite sa mga kumperensya kaysa sa mga siyentipikong journal. Ito ay dahil ang mga publikasyon sa journal ay may mga kinakailangan na mas mahirap matugunan, at ang proseso ng peer review ay maaaring tumagal ng mga buwan o kahit na taon. Ang computer science ay isang napakabilis na patlang, kaya ang mga may-akda ay karaniwang hindi handang maghintay ng ganoon katagal para sa publikasyon. Gayunpaman, ang isang artikulo na natanggap na para sa kumperensya ay maaaring dagdagan (halimbawa, sa pamamagitan ng paglalahad ng mas detalyadong mga resulta) at mai-publish sa isang journal kung saan ang mga paghihigpit sa espasyo ay hindi masyadong mahigpit.

Mga kaganapan sa kumperensya

Ang format para sa pagkakaroon ng mga may-akda ng mga naaprubahang artikulo sa kumperensya ay tinutukoy ng mga tagasuri. Kung ang artikulo ay binigyan ng berdeng ilaw, kung gayon ikaw ay madalas na inilalaan ng isang poster stand. Ang poster ay isang static na slide na may buod ng artikulo at mga guhit. Ang ilang mga conference room ay puno ng mahabang hanay ng mga poster stand. Ang may-akda ay gumugugol ng isang makabuluhang bahagi ng kanyang oras malapit sa kanyang poster, na nakikipag-usap sa mga siyentipiko na interesado sa artikulo.

Prize na pinangalanang Ilya Segalovich. Isang kwento tungkol sa computer science at paglulunsad ng mga publikasyon

Prize na pinangalanang Ilya Segalovich. Isang kwento tungkol sa computer science at paglulunsad ng mga publikasyon

Ang isang bahagyang mas prestihiyosong opsyon para sa pakikilahok ay isang lightning talk. Kung itinuturing ng mga tagasuri na ang artikulo ay karapat-dapat sa isang mabilis na ulat, ang may-akda ay binibigyan ng humigit-kumulang tatlong minuto upang magsalita sa isang malawak na madla. Sa isang banda, ang isang lightning talk ay isang magandang pagkakataon upang sabihin ang tungkol sa iyong ideya hindi lamang sa mga naging interesado sa poster sa kanilang sariling inisyatiba. Sa kabilang banda, ang mga proactive poster na bisita ay mas handa at mas nalulubog sa iyong partikular na paksa kaysa sa karaniwang tagapakinig sa hall. Samakatuwid, sa isang mabilis na ulat, kailangan mo pa ring magkaroon ng oras upang dalhin ang mga tao hanggang sa petsa.

Prize na pinangalanang Ilya Segalovich. Isang kwento tungkol sa computer science at paglulunsad ng mga publikasyon

Karaniwan, sa pagtatapos ng kanilang lightning talk, pinangalanan ng mga may-akda ang numero ng poster upang mahanap ito ng mga tagapakinig at mas maunawaan ang artikulo.

Prize na pinangalanang Ilya Segalovich. Isang kwento tungkol sa computer science at paglulunsad ng mga publikasyon

Ang pinakahuli, pinaka-prestihiyosong opsyon ay isang poster kasama ang isang ganap na presentasyon ng ideya, kapag hindi na kailangang magmadali upang sabihin ang kuwento.

Prize na pinangalanang Ilya Segalovich. Isang kwento tungkol sa computer science at paglulunsad ng mga publikasyon

Ngunit siyempre, ang mga siyentipiko - kabilang ang mga may-akda ng mga naaprubahang artikulo - ay pumupunta sa susunod na kumperensya hindi lamang upang ipakita. Una, may posibilidad silang maghanap ng mga poster na nauugnay sa kanilang larangan para sa mga malinaw na dahilan. At pangalawa, mahalaga para sa kanila na palawakin ang kanilang listahan ng mga contact para sa layunin ng magkasanib na gawaing pang-akademiko sa hinaharap. Hindi ito pangangaso - o, hindi bababa sa, ang pinakaunang yugto nito, na sinusundan man lang ng palitan ng mga ideya, pag-unlad at magkasanib na gawain sa isa o higit pang mga artikulo.

Kasabay nito, ang produktibong networking sa isang nangungunang kumperensya ay mahirap dahil sa kabuuang kakulangan ng libreng oras. Kung, pagkatapos ng isang buong araw na ginugol sa mga presentasyon at sa mga talakayan sa mga poster, napanatili ng siyentipiko ang kanyang lakas at nalampasan na ang jet lag, pagkatapos ay pupunta siya sa isa sa maraming mga partido. Ang mga ito ay hino-host ng mga korporasyon - bilang isang resulta, ang mga partido ay madalas na may higit na pangangaso. Kasabay nito, maraming mga bisita ang gumagamit ng mga ito hindi sa lahat upang makahanap ng isang bagong trabaho, ngunit, muli, para sa networking. Sa gabi ay wala nang mga ulat at poster - mas madaling "mahuli" ang espesyalista na interesado ka.

Prize na pinangalanang Ilya Segalovich. Isang kwento tungkol sa computer science at paglulunsad ng mga publikasyon

Mula sa ideya hanggang sa produksyon

Ang agham ng kompyuter ay isa sa ilang mga industriya kung saan ang mga interes ng mga korporasyon at mga startup ay malakas na nakaugnay sa kapaligirang pang-akademiko. Ang NIPS, ICML at iba pang katulad na mga kumperensya ay nakakaakit ng maraming tao mula sa industriya, hindi lamang sa mga unibersidad. Ito ay tipikal para sa larangan ng computer science, ngunit vice versa para sa karamihan ng iba pang mga agham.

Sa kabilang banda, hindi lahat ng ideyang ipinakita sa mga artikulo ay agad na napupunta sa paglikha o pagpapabuti ng mga serbisyo. Kahit na sa loob ng isang kumpanya, ang isang mananaliksik ay maaaring magmungkahi sa mga kasamahan mula sa serbisyo ng isang ideya na pambihirang tagumpay ng mga pamantayang pang-agham at makatanggap ng pagtanggi na ipatupad ito para sa ilang kadahilanan. Ang isa sa mga ito ay nabanggit na dito - ito ang pagkakaiba sa pagitan ng set ng data na "akademiko" kung saan isinulat ang artikulo at ang totoong set ng data. Bilang karagdagan, ang pagpapatupad ng isang ideya ay maaaring maantala, nangangailangan ng malaking halaga ng mga mapagkukunan, o mapabuti lamang ang isang tagapagpahiwatig sa halaga ng lumalalang iba pang mga sukatan.

Prize na pinangalanang Ilya Segalovich. Isang kwento tungkol sa computer science at paglulunsad ng mga publikasyon

Ang sitwasyon ay nai-save sa pamamagitan ng ang katunayan na ang maraming mga developer sa kanilang sarili ay isang bit ng mga mananaliksik. Dumadalo sila sa mga kumperensya, nagsasalita ng parehong wika sa mga akademiko, nagmumungkahi ng mga ideya, kung minsan ay lumalahok sa paglikha ng mga artikulo (halimbawa, pagsulat ng code), o kahit na kumikilos bilang mga may-akda mismo. Kung ang isang developer ay nahuhulog sa prosesong pang-akademiko, sumusunod sa kung ano ang nangyayari sa departamento ng pananaliksik, sa isang salita - kung siya ay nagpapakita ng isang kontra-kilusan patungo sa mga siyentipiko, kung gayon ang cycle ng paggawa ng mga siyentipikong ideya sa mga bagong kakayahan sa serbisyo ay paikliin.

Nais namin ang lahat ng mga batang mananaliksik na good luck at mahusay na mga tagumpay sa kanilang trabaho. Kung walang sinabi sa iyo ang post na ito ng anumang bago, maaaring nakapag-publish ka na sa isang nangungunang kumperensya. Magrehistro para sa premyo iyong sarili at humirang ng mga siyentipikong superbisor.

Pinagmulan: www.habr.com

Magdagdag ng komento