Илья Сегалович атындағы сыйлық. Информатика және шығарылымдар туралы әңгіме

Илья Сегалович атындағы сыйлық. Информатика және шығарылымдар туралы әңгіме

Бүгін біз Илья Сегалович атындағы ғылыми сыйлықты бастаймыз исег. Ол информатика саласындағы жетістіктері үшін марапатталады. Бакалавриат және аспирантура студенттері марапатқа өз өтінімін бере алады немесе ғылыми жетекшілерді тағайындайды. Лауреаттарды академиялық қоғамдастық пен Яндекс өкілдері таңдайды. Негізгі іріктеу критерийлері: жарияланымдар мен конференциялардағы баяндамалар, сонымен қатар қоғамдастықтың дамуына үлес қосу.

Алғашқы марапаттау рәсімі сәуір айында өтеді. Сыйлық аясында жас ғалымдар 350 мың рубль алады, сонымен қатар олар халықаралық конференцияға барып, тәлімгермен жұмыс істей алады және Яндекстің зерттеу бөлімінде тағылымдамадан өте алады. Ғылыми жетекшілер 700 мың рубль алады.

Сыйлықтың ашылуына орай біз Хабреде информатика әлеміндегі табыс критерийлері туралы сөйлесуді жөн көрдік. Кейбір Habr оқырмандары бұл критерийлермен бұрыннан таныс, ал басқаларында олар туралы жалған әсер болуы мүмкін. Бүгін біз бұл олқылықтың орнын толтырамыз - мақалалар, конференциялар, деректер жинақтары және ғылыми идеяларды қызметтерге беруді қоса алғанда, барлық негізгі тақырыптарды қозғаймыз.

Информатика саласындағы ғалымдар үшін табысқа жетудің басты критерийі – ғылыми жұмыстарының халықаралық деңгейдегі конференциялардың бірінде жариялануы. Бұл зерттеушінің жұмысын тануға арналған алғашқы «бақылау нүктесі». Мысалы, жалпы машиналық оқыту саласында Халықаралық машиналық оқыту конференциясы (ICML) және нейрондық ақпаратты өңдеу жүйелері бойынша конференция (NeurIPS, бұрынғы NIPS) ерекшеленеді. Компьютерлік көру, ақпаратты іздеу, сөйлеу технологиясы, машиналық аударма және т.б. сияқты ML-дің нақты бағыттары бойынша көптеген конференциялар бар.

Неліктен өз идеяларыңызды жариялау керек

Информатикадан алыс адамдарда ең құнды идеяларды жасырып, олардың бірегейлігінен пайда табуға тырысқан дұрыс деген қате түсінік болуы мүмкін. Алайда, біздің саладағы нақты жағдай мүлде керісінше. Ғалымның беделі оның еңбектерінің маңыздылығына, оның мақалаларына басқа ғалымдардың қаншалықты жиі сілтеме жасайтындығына қарай бағаланады (цитата индексі). Бұл оның мансабының маңызды сипаттамасы. Зерттеуші тұрақты түрде жарияланып, танымал болып, басқа ғалымдардың еңбектеріне негіз болатын мықты еңбектер шығарса ғана, өз ортасында беделі артып, кәсіби баспалдақтан жоғары көтеріледі.

Көптеген үздік мақалалар (мүмкін көпшілігі) дүние жүзіндегі әртүрлі университеттер мен компаниялардың зерттеушілері арасындағы ынтымақтастықтың нәтижесі болып табылады. Зерттеушінің мансабындағы маңызды және өте құнды сәт - ол өз тәжірибесіне сүйене отырып, өз бетінше идеяларды тауып, електен өткізу мүмкіндігіне ие болады - бірақ осыдан кейін де оның әріптестері оған баға жетпес көмек көрсетуді жалғастыруда. Ғалымдар бір-біріне идеяларды дамытуға, бірлесіп мақалалар жазуға көмектеседі - ғалымның ғылымға қосқан үлесі неғұрлым көп болса, оған пікірлес адамдарды табу оңайырақ болады.

Ақырында, ақпараттың тығыздығы мен қолжетімділігі соншалықты, әртүрлі зерттеушілер бір уақытта өте ұқсас (және шын мәнінде құнды) ғылыми идеяларды ұсынады. Егер сіз өз идеяңызды жарияламасаңыз, оны сіз үшін басқа біреу міндетті түрде жариялайды. «Жеңімпаз» көбінесе жаңалықты сәл ертерек ойлап тапқан адам емес, оны сәл ертерек жариялаған адам. Немесе – ойды барынша толық, анық, нанымды аша білген адам.

Илья Сегалович атындағы сыйлық. Информатика және шығарылымдар туралы әңгіме

Мақалалар мен деректер жинағы

Сонымен, ғылыми мақала зерттеуші ұсынатын негізгі идея төңірегінде құрылады. Бұл идея оның информатикаға қосқан үлесі. Мақала бірнеше сөйлеммен тұжырымдалған ойды сипаттаудан басталады. Одан кейін ұсынылып отырған инновацияның көмегімен шешілетін мәселелер ауқымын сипаттайтын кіріспе беріледі. Сипаттама мен кіріспе әдетте кең аудиторияға түсінікті қарапайым тілде жазылады. Кіріспеден кейін математикалық тілде берілген есептерді ресімдеп, қатаң жазуды енгізу қажет. Содан кейін енгізілген белгілерді пайдалана отырып, ұсынылған жаңашылдықтың мәнін нақты және жан-жақты тұжырымдап, бұрынғы, ұқсас әдістерден айырмашылығын анықтау керек. Барлық теориялық мәлімдемелер бұрын жинақталған дәлелдерге сілтемелермен расталуы немесе тәуелсіз түрде дәлелденуі керек. Бұл кейбір болжамдармен жасалуы мүмкін. Мысалы, жаттығу деректерінің шексіз саны болған жағдайда (айқын қол жетімсіз жағдай) немесе олар бір-бірінен толығымен тәуелсіз болған жағдайға дәлел келтіре аласыз. Мақаланың соңына таман ғалым өзі қол жеткізген эксперименттік нәтижелер туралы әңгімелейді.

Илья Сегалович атындағы сыйлық. Информатика және шығарылымдар туралы әңгіме

Конференцияны ұйымдастырушылар жалдаған рецензенттер мақаланы мақұлдау ықтималдығы жоғары болуы үшін оның бір немесе бірнеше атрибуттары болуы керек. Мақұлдау мүмкіндігін арттыратын негізгі фактор – ұсынылған идеяның ғылыми жаңалығы. Көбінесе жаңалық бұрыннан бар идеяларға қатысты бағаланады - және оны бағалау жұмысын рецензент емес, мақала авторының өзі жүргізеді. Ең дұрысы, автор мақалада бар әдістер туралы егжей-тегжейлі айтып, мүмкін болса, оларды өз әдісінің ерекше жағдайлары ретінде ұсынуы керек. Осылайша, ғалым қабылданған тәсілдер әрқашан нәтиже бермейтінін, оларды жалпылап, кеңірек, икемді, сондықтан тиімдірек теориялық тұжырымды ұсынғанын көрсетеді. Егер жаңалық жоққа шығарылмайтын болса, әйтпесе рецензенттер мақаланы соншалықты талғампаздықпен бағалайды - мысалы, олар нашар ағылшын тіліне көз жұмып қалуы мүмкін.

Жаңалықты күшейту үшін бір немесе бірнеше деректер жиынындағы бар әдістермен салыстыруды қосу пайдалы. Олардың әрқайсысы академиялық ортада ашық және қабылдануы керек. Мысалы, ImageNet сурет репозиторийі және модификацияланған Ұлттық стандарттар мен технологиялар институты (MNIST) және CIFAR (Канаданың кеңейтілген зерттеулер институты) сияқты институттардың дерекқорлары бар. Қиындық мынада: мұндай «академиялық» деректер жиынтығы көбінесе саламен айналысатын нақты деректерден мазмұн құрылымы бойынша ерекшеленеді. Әртүрлі деректер ұсынылған әдістің әртүрлі нәтижелерін білдіреді. Салада ішінара жұмыс істейтін ғалымдар мұны ескеруге тырысады және кейде «біздің деректерімізде нәтиже мынадай және мынадай, бірақ жалпыға ортақ деректер жиынтығында - осындай және осындай» сияқты жауапкершіліктен бас тарту туралы мәлімдемелер енгізеді.

Ұсынылған әдіс толығымен ашық деректер базасына «бейімделді» және нақты деректерде жұмыс істемейді. Сіз бұл жалпы мәселемен жаңа, көбірек өкілдік деректер жинақтарын ашу арқылы күресуге болады, бірақ біз көбінесе компаниялардың ашуға құқығы жоқ жеке мазмұн туралы айтамыз. Кейбір жағдайларда олар деректерді анонимдеу (кейде күрделі және қиын) жүзеге асырады - олар белгілі бір адамға нұсқайтын кез келген фрагменттерді жояды. Мысалы, фотосуреттердегі беттер мен сандар өшіріледі немесе оқылмайды. Сонымен қатар, деректер жинағы барлығына қол жетімді болуы үшін ғана емес, ғалымдар арасында идеяларды салыстыруға ыңғайлы стандартқа айналуы үшін оны жариялап қана қоймай, сонымен қатар бұл туралы бөлек мақала жазу керек. ол және оның артықшылықтары.

Зерттелетін тақырыпта ашық деректер жинағы болмаған кезде бұл нашар. Сонда рецензент автордың сенім бойынша ұсынған нәтижелерін ғана қабылдай алады. Теориялық тұрғыдан, автор тіпті оларды асыра бағалап, анықталмай қалуы мүмкін, бірақ академиялық ортада бұл екіталай, өйткені бұл ғалымдардың басым көпшілігінің ғылымды дамытуға деген ұмтылысына қайшы келеді.

Компьютерлік көруді қоса, ML-дің бірқатар салаларында мақалалармен кодқа (әдетте GitHub-қа) сілтемелер қосу жиі кездеседі. Мақаланың өзінде не өте аз код бар, не псевдокод болып табылады. Бұл жерде, егер мақаланы университеттен емес, компанияның зерттеушісі жазған болса, қиындықтар туындайды. Әдепкі бойынша, корпорацияда немесе іске қосуда жазылған код NDA деп белгіленеді. Зерттеушілер мен олардың әріптестері сипатталатын идеяға қатысты кодты ішкі және, әрине, жабық репозиторийлерден бөлу үшін көп жұмыс істеуі керек.

Жариялану мүмкіндігі таңдалған тақырыптың өзектілігіне де байланысты. Өзектілік негізінен өнімдер мен қызметтерге байланысты: егер корпорация немесе стартап мақаладағы идея негізінде жаңа қызметті құруға немесе барын жақсартуға мүдделі болса, бұл плюс.

Илья Сегалович атындағы сыйлық. Информатика және шығарылымдар туралы әңгіме

Жоғарыда айтылғандай, информатика бойынша мақалалар сирек жеке жазылады. Бірақ, әдетте, авторлардың бірі басқаларына қарағанда әлдеқайда көп уақыт пен күш жұмсайды. Оның ғылыми жаңалыққа қосқан үлесі ең үлкен. Авторлар тізімінде мұндай адам бірінші болып көрсетіледі - және болашақта мақалаға сілтеме жасағанда олар тек оны атап өтуге болады (мысалы, «Иванов және т.б.» - «Иванов және т.б.» латын тілінен аударылған). Дегенмен, басқалардың қосқан үлестері де өте құнды - әйтпесе авторлар тізімінде болу мүмкін емес.

Қарау процесі

Әдетте конференцияға бірнеше ай қалғанда баяндамалар қабылданбайды. Мақала жіберілгеннен кейін рецензенттер оны оқып, бағалап, пікір білдіру үшін 3-5 апта уақыт алады. Бұл жалғыз соқыр жүйе бойынша авторлар рецензенттердің аты-жөнін көрмеген кезде немесе қосарланған соқырлар, рецензенттер авторлардың есімдерін көрмеген кезде орын алады. Екінші нұсқа неғұрлым бейтарап болып саналады: бірнеше ғылыми жұмыстар автордың танымалдылығы рецензенттің шешіміне әсер ететінін көрсетті. Мысалы, ол қазірдің өзінде жарияланған мақалалары көп ғалымды жоғары рейтингке лайық деп санауы мүмкін.

Оның үстіне қос соқыр болған жағдайда да рецензент автордың бір салада жұмыс істейтінін болжайтын шығар. Сонымен қатар, шолу кезінде мақала ғылыми мақалалардың ең үлкен репозиторийі arXiv дерекқорында жарияланған болуы мүмкін. Конференцияны ұйымдастырушылар бұған тыйым салмайды, бірақ олар arXiv үшін жарияланымдарда басқа атау мен басқа рефератты пайдалануды ұсынады. Бірақ егер мақала сол жерде жарияланған болса, оны табу әлі де қиын болмайды.

Мақаланы бағалайтын бірнеше рецензенттер әрқашан болады. Олардың біріне мета-рецензент рөлі жүктелген, ол тек әріптестерінің үкімдерін қарап, соңғы шешімді қабылдауы керек. Егер рецензенттер мақаламен келіспесе, мета-рецензент оны толықтығы үшін оқи алады.

Кейде рейтинг пен пікірлерді қарап шыққаннан кейін автордың рецензентпен пікірталасқа түсу мүмкіндігі болады; тіпті оны өз шешімін өзгертуге сендіруге мүмкіндік бар (бірақ мұндай жүйе барлық конференциялар үшін жұмыс істемейді, ал үкімге шындап әсер ету одан да азырақ). Талқылау кезінде сіз мақалада сілтеме жасалғандарды қоспағанда, басқа ғылыми жұмыстарға сілтеме жасай алмайсыз. Тек шолушыға мақаланың мазмұнын жақсырақ түсінуге «көмектесуге» болады.

Илья Сегалович атындағы сыйлық. Информатика және шығарылымдар туралы әңгіме

Конференциялар мен журналдар

Информатика бойынша мақалалар ғылыми журналдарға қарағанда конференцияларға жиі жіберіледі. Себебі журнал жарияланымдарында орындау қиынырақ талаптар болады, ал сараптау процесі айлар немесе тіпті жылдарға созылуы мүмкін. Информатика - өте жылдам қозғалатын сала, сондықтан авторлар жариялану үшін әдетте көп уақыт күтуге дайын емес. Дегенмен, конференцияға қабылданған мақаланы кейін толықтыруға болады (мысалы, егжей-тегжейлі нәтижелерді ұсыну арқылы) және кеңістік шектеулері соншалықты қатаң емес журналда жарияланады.

Конференциядағы оқиғалар

Мақұлданған мақалалардың авторларының конференцияға қатысу форматын рецензенттер анықтайды. Егер мақалаға жасыл жарық жағылса, сізге көбінесе плакат стенді бөлінеді. Постер - бұл мақаланың қысқаша мазмұны мен иллюстрациялары бар статикалық слайд. Кейбір конференц-залдар плакат стендтерінің ұзын қатарларымен толтырылған. Автор уақытының қомақты бөлігін өз постерінің қасында, мақалаға қызығушылық танытқан ғалымдармен араласып отырады.

Илья Сегалович атындағы сыйлық. Информатика және шығарылымдар туралы әңгіме

Илья Сегалович атындағы сыйлық. Информатика және шығарылымдар туралы әңгіме

Қатысудың біршама беделді нұсқасы - найзағайлы әңгіме. Рецензенттер мақаланы жылдам баяндама жасауға лайық деп тапса, авторға кең аудиториямен сөйлесу үшін үш минуттай уақыт беріледі. Бір жағынан, найзағайлы әңгіме - бұл постерге өз бастамасымен қызығушылық танытқандарға ғана емес, сіздің идеяңыз туралы айтудың жақсы мүмкіндігі. Екінші жағынан, постерге белсенді келушілер залдағы қарапайым тыңдаушыға қарағанда сіздің нақты тақырыбыңызға көбірек дайындалады және көбірек енеді. Сондықтан, жылдам есепте сіз әлі де адамдарды жаңартып отыруға уақытыңыз болуы керек.

Илья Сегалович атындағы сыйлық. Информатика және шығарылымдар туралы әңгіме

Әдетте, авторлар өздерінің найзағайдай баяндамасының соңында тыңдаушылар оны тауып, мақаланы жақсы түсінуі үшін постер нөмірін атайды.

Илья Сегалович атындағы сыйлық. Информатика және шығарылымдар туралы әңгіме

Соңғы, ең беделді нұсқа - бұл постер плюс идеяның толыққанды тұсаукесері, енді оқиғаны айтуға асықпаудың қажеті жоқ.

Илья Сегалович атындағы сыйлық. Информатика және шығарылымдар туралы әңгіме

Бірақ, әрине, ғалымдар, соның ішінде мақұлданған мақалалардың авторлары - келесі конференцияға тек қана мақтану үшін емес. Біріншіден, олар белгілі себептермен өз саласына қатысты плакаттарды табуға бейім. Екіншіден, олар үшін болашақта бірлескен оқу жұмысы мақсатында байланыстар тізімін кеңейту маңызды. Бұл аң аулау емес - немесе, кем дегенде, оның ең бірінші кезеңі, ол кем дегенде бір немесе бірнеше мақалалар бойынша өзара тиімді пікір алмасу, әзірлемелерді және бірлескен жұмысты жалғастырады.

Сонымен қатар, бос уақыттың толық болмауына байланысты жоғарғы конференцияда өнімді желі құру қиын. Егер бір күн бойы презентацияларда және плакаттардағы талқылауларда болған ғалым өзінің күшін сақтап, реактивті лагты жеңіп үлгерсе, онда ол көптеген кештердің біріне барады. Оларды корпорациялар қабылдайды - нәтижесінде тараптар жиі аңшылық сипатқа ие. Сонымен қатар, көптеген қонақтар оларды мүлдем жаңа жұмыс табу үшін емес, қайтадан желілік байланыс үшін пайдаланады. Кешке есептер мен плакаттар болмайды - сізді қызықтыратын маманды «ұстап алу» оңайырақ.

Илья Сегалович атындағы сыйлық. Информатика және шығарылымдар туралы әңгіме

Идеядан өндіріске дейін

Информатика – корпорациялар мен стартаптардың мүдделері академиялық ортамен тығыз байланысты болатын санаулы салалардың бірі. NIPS, ICML және басқа да осыған ұқсас конференциялар университеттерден ғана емес, өнеркәсіптен де көптеген адамдарды тартады. Бұл информатика саласына тән, бірақ басқа ғылымдардың көпшілігі үшін керісінше.

Екінші жағынан, мақалаларда ұсынылған барлық идеялар бірден қызметтерді құруға немесе жақсартуға бағыттала бермейді. Тіпті бір компанияның ішінде де зерттеуші қызметтегі әріптестеріне ғылыми стандарттар бойынша серпіліс болып табылатын идеяны ұсына алады және бірқатар себептер бойынша оны жүзеге асырудан бас тарта алады. Олардың бірі осы жерде айтылып кетті - бұл мақала жазылған «академиялық» деректер жиынтығы мен нақты деректер жиынтығы арасындағы айырмашылық. Бұған қоса, идеяны іске асыру кешіктірілуі мүмкін, ресурстардың үлкен көлемін талап етеді немесе басқа көрсеткіштердің нашарлауына байланысты тек бір көрсеткішті жақсартуы мүмкін.

Илья Сегалович атындағы сыйлық. Информатика және шығарылымдар туралы әңгіме

Жағдай көптеген әзірлеушілердің өздері аздап зерттеушілер болғандықтан сақталады. Олар конференцияларға қатысады, академиктермен бір тілде сөйлейді, идеяларды ұсынады, кейде мақалаларды жасауға қатысады (мысалы, код жазу) немесе тіпті авторлардың өздері де әрекет етеді. Егер әзірлеуші ​​оқу үдерісіне еніп кетсе, ғылыми-зерттеу бөлімінде не болып жатқанын қадағаласа, бір сөзбен айтқанда – ғалымдарға қарсы қозғалысты көрсетсе, ғылыми идеяларды жаңа қызмет көрсету мүмкіндіктеріне айналдыру циклі қысқарады.

Барлық жас зерттеушілерге сәттілік пен жұмыстарында үлкен жетістіктер тілейміз. Егер бұл жазба сізге жаңа ештеңе айтпаса, сіз жоғары деңгейдегі конференцияда жариялаған болуыңыз мүмкін. үшін тіркелу жүлде өзіңіз және ғылыми жетекшілер тағайындаңыз.

Ақпарат көзі: www.habr.com

пікір қалдыру