Награда названа по Иљи Сегаловичу. Прича о информатици и лансирању публикација

Награда названа по Иљи Сегаловичу. Прича о информатици и лансирању публикација

Данас покрећемо научну награду која носи име Иље Сегаловича исег. Додељиваће се за достигнућа у области рачунарства. Студенти основних и постдипломских студија могу поднети сопствену пријаву за награду или именује научне руководиоце. Лауреате ће изабрати представници академске заједнице и Иандек-а. Главни критеријуми избора: публикације и презентације на конференцијама, као и допринос развоју заједнице.

Прва свечана додела награда биће одржана у априлу. У оквиру награде, млади научници ће добити 350 хиљада рубаља, а осим тога, моћи ће да оду на међународну конференцију, раде са ментором и прођу праксу у одељењу за истраживање Иандек-а. Научни надзорници ће добити 700 хиљада рубаља.

Поводом доделе награде, одлучили смо да овде на Хабреу разговарамо о критеријумима успеха у свету рачунарства. Неки читаоци Хабра су већ упознати са овим критеријумима, док други могу имати лажан утисак о њима. Данас ћемо премостити овај јаз – дотакнућемо се свих главних тема, укључујући чланке, конференције, скупове података и трансфер научних идеја у услуге.

За научнике из области рачунарства, главни критеријум успеха је објављивање њиховог научног рада на некој од врхунских међународних конференција. Ово је прва „контролна тачка“ за препознавање рада истраживача. На пример, у области машинског учења уопште, издвајају се Међународна конференција о машинском учењу (ИЦМЛ) и Конференција о системима за неуралну обраду информација (НеурИПС, раније НИПС). Постоји много конференција о специфичним областима МЛ, као што су компјутерски вид, проналажење информација, технологија говора, машинско превођење итд.

Зашто објављивати своје идеје

Људи који су далеко од информатике могу имати погрешно мишљење да је боље чувати највредније идеје у тајности и настојати да профитирају од њихове јединствености. Међутим, реална ситуација на нашем терену је управо супротна. Ауторитет научника се оцењује по значају његових радова, по томе колико често његове чланке цитирају други научници (индекс цитата). Ово је важна карактеристика његове каријере. Истраживач напредује на професионалној лествици, постајући све поштованији у својој заједници, само ако доследно производи снажан рад који се објављује, постаје познат и чини основу за рад других научника.

Многи врхунски чланци (можда већина) резултат су сарадње између истраживача са различитих универзитета и компанија широм света. Важан и веома вредан моменат у каријери истраживача је када он добије прилику да на основу свог искуства сам пронађе и процеји идеје – али и након тога, колеге настављају да му пружају непроцењиву помоћ. Научници помажу једни другима да развију идеје, пишу чланке у сарадњи - и што је већи допринос научника науци, лакше му је да пронађе истомишљенике.

Коначно, густина и доступност информација сада је толико велика да различити истраживачи истовремено долазе до веома сличних (и заиста вредних) научних идеја. Ако ви не објавите своју идеју, неко други ће је скоро сигурно објавити уместо вас. „Победник” често није онај ко је нешто раније смислио иновацију, већ онај ко ју је објавио нешто раније. Или – онај ко је успео да што потпуније, јасније и убедљивије открије идеју.

Награда названа по Иљи Сегаловичу. Прича о информатици и лансирању публикација

Чланци и скупови података

Дакле, научни чланак се гради око главне идеје коју истраживач предлаже. Ова идеја је његов допринос информатици. Чланак почиње описом идеје, формулисаним у неколико реченица. Након тога следи увод који описује низ проблема који се решавају уз помоћ предложене иновације. Опис и увод су обично написани једноставним језиком који је разумљив широкој публици. Након увода, потребно је формализовати проблеме представљене математичким језиком и увести строгу нотацију. Затим, користећи уведене нотације, потребно је да креирате јасну и свеобухватну изјаву о суштини предложене иновације и идентификујете разлике у односу на претходне, сличне методе. Све теоријске изјаве морају бити поткријепљене референцама на претходно прикупљене доказе или морају бити доказане независно. Ово се може урадити уз неке претпоставке. На пример, можете дати доказ за случај када постоји бесконачна количина података за обуку (очигледно недостижна ситуација) или су потпуно независни један од другог. Пред крај чланка, научник говори о експерименталним резултатима које је успео да добије.

Награда названа по Иљи Сегаловичу. Прича о информатици и лансирању публикација

Да би рецензенти које су ангажовали организатори конференције вероватније да ће одобрити рад, он мора имати један или више атрибута. Кључни фактор који повећава шансе за одобрење је научна новина предложене идеје. Често се новина процењује у односу на већ постојеће идеје – а посао на њеној процени не обавља рецензент, већ сам аутор чланка. Идеално би било да аутор у чланку детаљно исприча о постојећим методама и, ако је могуће, представи их као посебне случајеве свог метода. Тиме научник показује да прихваћени приступи не функционишу увек, да их је генерализовао и предложио ширу, флексибилнију и самим тим ефикаснију теоријску формулацију. Ако је новина неоспорна, у супротном рецензенти оцењују чланак не тако избирљиво - на пример, могу да зажмуре на лош енглески.

Да би се појачала новина, корисно је укључити поређење са постојећим методама на једном или више скупова података. Сваки од њих треба да буде отворен и прихваћен у академском окружењу. На пример, постоји ИмагеНет складиште слика и базе података института као што су Модификовани национални институт за стандарде и технологију (МНИСТ) и ЦИФАР (Канадски институт за напредна истраживања). Потешкоћа је у томе што се такав „академски“ скуп података често разликује по структури садржаја од стварних података којима се индустрија бави. Различити подаци значе различите резултате предложене методе. Научници који делимично раде за индустрију покушавају да то узму у обзир и понекад убацују одрицање од одговорности попут „на нашим подацима резултат је такав или такав, али на јавном скупу података – такав и такав“.

Дешава се да је предложени метод потпуно „скројен“ за отворену базу података и не ради на стварним подацима. Можете се борити против овог уобичајеног проблема отварањем нових, репрезентативнијих скупова података, али често говоримо о приватном садржају који компаније једноставно немају право да отварају. У неким случајевима спроводе (понекад сложену и мукотрпну) анонимизацију података - уклањају све фрагменте који упућују на одређену особу. На пример, лица и бројеви на фотографијама се бришу или чине нечитким. Осим тога, да би скуп података био не само доступан свима, већ и постао стандард међу научницима на коме је згодно упоређивати идеје, потребно је не само да га објавите, већ и да напишете посебан цитирани чланак о оно и његове предности.

Још је горе када нема отворених скупова података у теми која се проучава. Тада рецензент може само на веру прихватити резултате које је аутор представио. Теоретски, аутор би их могао чак и преценити и остати неоткривен, али у академском окружењу то је мало вероватно, јер се коси са жељом велике већине научника да развијају науку.

У бројним областима МЛ-а, укључујући компјутерски вид, такође је уобичајено да се уз чланке додају везе у код (обично на ГитХуб). Сами чланци или садрже врло мало кода или су псеудокод. И ту, опет, потешкоће настају ако чланак пише истраживач из компаније, а не са универзитета. Подразумевано, код написан у корпорацији или стартупу је означен као НДА. Истраживачи и њихове колеге морају напорно да раде како би одвојили код везан за идеју која се описује од интерних и свакако затворених складишта.

Шанса за објављивање зависи и од релевантности одабране теме. Релевантност је у великој мери диктирана производима и услугама: ако је корпорација или стартап заинтересован за изградњу нове услуге или побољшање постојеће на основу идеје из чланка, то је плус.

Награда названа по Иљи Сегаловичу. Прича о информатици и лансирању публикација

Као што је већ поменуто, радови из рачунарства се ретко пишу сами. Али по правилу, један од аутора троши много више времена и труда од осталих. Његов допринос научној новини је највећи. На списку аутора, таква особа је прва назначена - а убудуће, када се позива на чланак, могу само да га помену (на пример, „Иванов и други“ - „Иванов и други“ у преводу са латинског). Међутим, и доприноси других су изузетно драгоцени – иначе је немогуће бити на списку аутора.

Процес прегледа

Радови обично престају да се примају неколико месеци пре конференције. Након што се чланак пошаље, рецензенти имају 3–5 недеља да га прочитају, процене и коментаришу. Ово се дешава по једноструком слепом систему, када аутори не виде имена рецензената, или двоструком слепом, када сами рецензенти не виде имена аутора. Друга опција се сматра непристраснијом: неколико научних радова је показало да популарност аутора утиче на одлуку рецензента. На пример, он може сматрати да је научник са великим бројем већ објављених чланака а приори вредан веће оцене.

Штавише, чак иу случају двоструке слепе, рецензент ће вероватно погодити аутора ако раде у истој области. Поред тога, у време прегледа, чланак би можда већ био објављен у бази података арКсив, највећем репозиторијуму научних радова. Организатори конференције то не забрањују, али препоручују коришћење другог наслова и другачијег сажетка у публикацијама за арКсив. Али ако је чланак тамо постављен, и даље га неће бити тешко пронаћи.

Увек постоји неколико рецензената који оцењују чланак. Једном од њих је додељена улога метарецензента, који само треба да прегледа пресуде својих колега и донесе коначну одлуку. Ако се рецензенти не слажу у вези са чланком, мета-рецензент га такође може прочитати ради потпуности.

Понекад, након прегледа оцене и коментара, аутор има прилику да уђе у дискусију са рецензентом; чак постоји шанса да га убеди да промени своју одлуку (међутим, такав систем не функционише за све конференције, а још мање је могуће озбиљно утицати на пресуду). У дискусији се не можете позивати на друге научне радове, осим оних који су већ наведени у чланку. Можете само да „помогнете“ рецензенту да боље разуме садржај чланка.

Награда названа по Иљи Сегаловичу. Прича о информатици и лансирању публикација

Конференције и часописи

Рачунарски чланци се чешће шаљу на конференције него у научне часописе. То је зато што публикације у часописима имају захтеве које је теже испунити, а процес рецензије може трајати месецима или чак годинама. Рачунарство је област која се веома брзо развија, тако да аутори обично нису вољни да чекају толико дуго на објављивање. Међутим, чланак који је већ прихваћен за конференцију може се затим допунити (на пример, представљањем детаљнијих резултата) и објавити у часопису где ограничења простора нису тако строга.

Догађаји на конференцији

Формат присуства аутора одобрених чланака на конференцији одређују рецензенти. Ако је чланку дато зелено светло, онда вам се најчешће додељује штанд за постер. Постер је статични слајд са резимеом чланка и илустрацијама. Неке конференцијске сале су испуњене дугим редовима штандова за постере. Аутор проводи значајан део свог времена у близини свог постера, комуницирајући са научницима који су заинтересовани за чланак.

Награда названа по Иљи Сегаловичу. Прича о информатици и лансирању публикација

Награда названа по Иљи Сегаловичу. Прича о информатици и лансирању публикација

Нешто престижнија опција за учешће је муњевит разговор. Ако рецензенти сматрају да је чланак вредан кратког извештаја, аутору је дато око три минута да говори широкој публици. С једне стране, муњевит разговор је добра прилика да о својој идеји испричате не само онима који су се самоиницијативно заинтересовали за постер. С друге стране, проактивни посетиоци постера су спремнији и више уроњени у вашу специфичну тему од просечног слушаоца у сали. Стога, у брзом извештају, још увек морате да имате времена да обавестите људе о новостима.

Награда названа по Иљи Сегаловичу. Прича о информатици и лансирању публикација

Обично, на крају свог муњевитог говора, аутори именују број постера како би га слушаоци могли пронаћи и боље разумети чланак.

Награда названа по Иљи Сегаловичу. Прича о информатици и лансирању публикација

Последња, најпрестижнија опција је постер плус пуна презентација идеје, када више нема потребе да се жури да се прича.

Награда названа по Иљи Сегаловичу. Прича о информатици и лансирању публикација

Али наравно, научници – укључујући и ауторе одобрених чланака – долазе на следећу конференцију не само да би се показали. Прво, они имају тенденцију да пронађу постере који се односе на њихову област из очигледних разлога. И друго, важно им је да прошире своју листу контаката у циљу заједничког академског рада у будућности. Ово није лов - или, барем, његова прва фаза, коју у најмању руку прати обострано корисна размена идеја, развоја и заједнички рад на једном или више чланака.

Истовремено, продуктивно умрежавање на врхунској конференцији је тешко због потпуног недостатка слободног времена. Ако је научник након целог дана проведеног на презентацијама и дискусијама на постерима задржао снагу и већ је савладао џет лаг, онда одлази на једну од многих забава. Угошћују их корпорације - као резултат тога, забаве често имају више ловачки карактер. Истовремено, многи гости их користе уопште не за проналажење новог посла, већ, опет, за умрежавање. Увече више нема извештаја и постера - лакше је „ухватити“ специјалисте за који сте заинтересовани.

Награда названа по Иљи Сегаловичу. Прича о информатици и лансирању публикација

Од идеје до производње

Рачунарска наука је једна од ретких индустрија у којој су интереси корпорација и стартапова снажно повезани са академским окружењем. НИПС, ИЦМЛ и друге сличне конференције привлаче много људи из индустрије, не само са универзитета. Ово је типично за област рачунарства, али обрнуто за већину других наука.

С друге стране, све идеје представљене у чланцима не иду одмах ка креирању или побољшању услуга. Чак и унутар једне компаније, истраживач може колегама из службе да предложи идеју која је револуционарна по научним стандардима и добије одбијеницу да је спроведе из више разлога. Један од њих је већ поменут овде - ово је разлика између „академског“ скупа података на којем је чланак написан и стварног скупа података. Поред тога, имплементација идеје може бити одложена, захтевати велику количину ресурса или побољшати само један индикатор по цену погоршања других показатеља.

Награда названа по Иљи Сегаловичу. Прича о информатици и лансирању публикација

Ситуацију спашава чињеница да су многи програмери и сами помало истраживачи. Они присуствују конференцијама, говоре истим језиком са академицима, предлажу идеје, понекад учествују у креирању чланака (на пример, писање кода), или чак и сами делују као аутори. Ако је програмер уроњен у академски процес, прати шта се дешава у истраживачком одељењу, једном речју – ако демонстрира контрапокрет према научницима, онда се скраћује циклус претварања научних идеја у нове сервисне могућности.

Свим младим истраживачима желимо пуно среће и успеха у раду. Ако вам овај пост није рекао ништа ново, можда сте већ објавили на врхунској конференцији. Регистрацију за премиум себе и именовати научне руководиоце.

Извор: ввв.хабр.цом

Додај коментар