Xelata bi navê Ilya Segalovich. Çîrokek li ser zanistiya computer û weşanên destpêkirinê

Xelata bi navê Ilya Segalovich. Çîrokek li ser zanistiya computer û weşanên destpêkirinê

Îro em xelata zanistî ya bi navê Ilya Segalovich dest pê dikin iseg. Ew ê ji bo destkeftiyên di warê zanistiya kompîturê de were xelat kirin. Xwendekarên lîsans û lîsansê dikarin serlêdana xwe ji bo xelatê pêşkêş bikin an jî çavdêrên zanistî destnîşan bikin. Xelatgir dê ji aliyê nûnerên civaka akademîk û Yandex ve werin hilbijartin. Pîvanên hilbijartinê yên sereke: weşan û pêşkêşiyên li konferansan, û her weha beşdarî pêşveçûna civakê.

Merasîma xelatdayînê ya yekem dê di meha Nîsanê de pêk were. Di çarçoveya xelatê de, zanyarên ciwan dê 350 hezar rubleyan bistînin, û ji bilî vê, ew ê karibin biçin konferansek navneteweyî, bi şêwirmendek re bixebitin û di beşa lêkolînê ya Yandex de navendek derbas bikin. Çavdêrên zanistî dê 700 hezar rûbil bistînin.

Bi munasebeta destpêkirina xelatê, me biryar da ku em li vir li ser Habré li ser pîvanên serfiraziyê di cîhana zanistiya kompîturê de biaxivin. Hin xwendevanên Habrê jixwe bi van pîvanan nas in, hinên din jî dibe ku di derheqê wan de nerînek derewîn hebe. Îro em ê vê valahiyê derbas bikin - em ê li ser hemî mijarên sereke, di nav de gotar, konfêrans, berhevokên daneyan û veguheztina ramanên zanistî di nav karûbaran de, biaxivin.

Ji bo zanyarên di warê zanista kompîturê de, pîvana serekî ya serkeftinê, weşandina xebatên wan ên zanistî li yek ji konferansên navneteweyî yên herî bilind e. Ev yekem "xala kontrolê" ye ji bo naskirina xebata lêkolîner. Mînakî, di warê fêrbûna makîneyê de bi gelemperî, Konferansa Navneteweyî ya li ser Fêrbûna Makîneyê (ICML) û Konferansa Pergalên Pêvajoya Agahdariya Neural (NeurIPS, berê NIPS) têne cûda kirin. Gelek konferans li ser deverên taybetî yên ML hene, wek vîzyona komputerê, wergirtina agahdarî, teknolojiya axaftinê, wergera makîneyê, hwd.

Çima ramanên xwe biweşînin

Kesên ku ji zanistiya kompîturê dûr in, dibe ku têgihîştina xelet hebe ku çêtir e ku ramanên herî hêja veşartî bimînin û hewl bidin ku ji bêhempabûna wan sûd werbigirin. Lê belê, rewşa rastî ya li qada me tam berevajî ye. Desthilatdariya zanyarek ji hêla girîngiya xebatên wî ve, ji hêla çend caran gotarên wî ji hêla zanyarên din ve têne vegotin (indeksa navgîniyê) tê darizandin. Ev taybetmendiyek girîng a kariyera wî ye. Lêkolerek di pêlên pîşeyî de hildiweşe, di civata xwe de bêtir rêzdar dibe, tenê heke ew bi domdarî xebatên xurt ên ku têne weşandin, navdar dibin û bingehek ji bo xebata zanyarên din çêbike.

Gelek gotarên jorîn (dibe ku pir) encama hevkariya di navbera lêkolînerên li zanîngeh û pargîdaniyên cihêreng ên li çaraliyê cîhanê de ne. Demek girîng û pir bi nirx di kariyera lêkolîner de ew e ku ew fersendê distîne ku li ser bingeha ezmûna xwe bi serê xwe ramanan bibîne û bişopîne - lê piştî vê yekê jî, hevkarên wî berdewam dikin ku wî arîkariya giranbiha pêşkêş bikin. Zanyar ji hev re dibin alîkar ku ramanan pêş bixin, bi hevkariyê gotaran binivîsin - û her ku tevkariya zanyar di zanistiyê de mezintir be, ew qas hêsantir e ku ew mirovên hevfikir bibîne.

Di dawiyê de, tîrbûn û hebûna agahdariyê naha ew qas mezin e ku lêkolînerên cihêreng di heman demê de ramanên zanistî yên pir dişibin (û bi rastî hêja) derdikevin. Ger hûn ramana xwe neweşînin, yekî din hema bêje wê ji we re biweşîne. "Serketî" pir caran ne ew e ku hinekî pêştir nûjenî kiriye, lê yê ku ew hinekî pêştir çap kiriye. An jî - yê ku kariye ramanê bi qasî ku pêkan bi tevahî, zelal û pêbawer eşkere bike.

Xelata bi navê Ilya Segalovich. Çîrokek li ser zanistiya computer û weşanên destpêkirinê

Gotar û databas

Ji ber vê yekê, gotarek zanistî li dora ramana sereke ya ku lêkolîner pêşniyar dike hatî çêkirin. Ev raman tevkariya wî ya zanistiya komputerê ye. Gotar bi danasîna ramanê, ku di çend hevokan de hatî formulekirin, dest pê dike. Li pey vê yekê pêşgotinek ku rêza pirsgirêkên ku bi alîkariya nûjeniya pêşniyarkirî hatine çareser kirin vedibêje. Danasîn û danasînê bi gelemperî bi zimanek hêsan ku ji temaşevanek berfireh re tê fam kirin têne nivîsandin. Piştî danasînê, pêdivî ye ku pirsgirêkên ku di zimanê matematîkî de hatine pêşkêş kirin fermî bikin û nîşanek hişk were danîn. Dûv re, bi karanîna nîgarên destnîşankirî, hûn hewce ne ku daxuyaniyek zelal û berfireh a cewhera nûjeniya pêşniyarkirî biafirînin, û cûdahiyên ji rêbazên berê, yên wekhev nas bikin. Pêdivî ye ku hemî daxuyaniyên teorîkî an bi referansên delîlên berê hatine berhev kirin werin piştgirî kirin, an jî serbixwe bêne îsbat kirin. Dibe ku ev bi hin texmînan were kirin. Mînakî, hûn dikarin ji bo dozê delîlek bidin dema ku hejmareke bêdawî ya daneya perwerdehiyê heye (rewşek eşkere negihîştî) an ew bi tevahî ji hev serbixwe ne. Di dawiya gotarê de, zanyar li ser encamên ceribandinê yên ku wî karîbû bi dest bixe diaxive.

Xelata bi navê Ilya Segalovich. Çîrokek li ser zanistiya computer û weşanên destpêkirinê

Ji bo ku vekolerên ku ji hêla organîzatorên konferansê ve hatine berhev kirin bi îhtîmalek pirtir kaxezek bipejirînin, pêdivî ye ku ew xwediyê yek an çend taybetmendiyan be. Faktorek bingehîn a ku şansên pejirandinê zêde dike nûbûna zanistî ya ramana pêşniyarkirî ye. Bi gelemperî, nûbûn bi ramanên jixwe heyî ve têne nirxandin - û xebata nirxandina wê ne ji hêla vekoler ve, lê ji hêla nivîskarê gotarê ve bi xwe ve tête kirin. Bi îdeal, divê nivîskar di gotarê de bi hûrgulî li ser rêbazên heyî vebêje û heke gengaz be, wan wekî rewşên taybetî yên rêbaza xwe pêşkêş bike. Ji ber vê yekê, zanyar nîşan dide ku nêzîkatiyên pejirandî her gav naxebitin, ku wî ew gelemperî kirin û formulasyonek teorîkî berfirehtir, maqûltir û ji ber vê yekê bandorkertir pêşniyar kir. Ger nûbûn nayê înkar kirin, wê hingê vekoler gotarê ne ew qas bijarte dinirxînin - mînakî, ew dikarin çavê xwe li Englishngilîzî ya belengaz bigirin.

Ji bo xurtkirina nûbûnê, bikêr e ku meriv berhevokek bi metodên heyî re li ser yek an çend danehevan pêk bîne. Divê her yek ji wan di hawîrdora akademîk de vekirî û pejirandin. Mînakî, depoya wêneya ImageNet û databasên enstîtûyên wekî Enstîtuya Neteweyî ya Guherîn a Standard û Teknolojiyê (MNIST) û CIFAR (Enstîtuya Kanadayî Ji bo Lêkolînên Pêşkeftî) hene. Zehmetî ev e ku danehevek wusa "akademîk" bi gelemperî di avahiya naverokê de ji daneyên rastîn ên ku pîşesaziyê pê re mijûl dibe cûda dibe. Daneyên cihêreng tê wateya encamên cûda yên rêbaza pêşniyarkirî. Zanyarên ku bi qismî ji bo pîşesaziyê dixebitin hewl didin ku vê yekê li ber çavan bigirin û carinan nerazîbûnên wekî "li ser daneyên me encam wusa û wusa ye, lê li ser daneya giştî - wilo û wusa ye."

Wusa diqewime ku rêbaza pêşniyarkirî bi tevahî ji databasek vekirî re "rêxistinkirî" ye û li ser daneyên rastîn naxebite. Hûn dikarin bi vekirina danehevên nû, nûnertir, li dijî vê pirsgirêka hevpar şer bikin, lê pir caran em behsa naveroka taybet dikin ku pargîdanî bi tenê mafê vekirina wê tune. Di hin rewşan de, ew anonîmîzekirina daneyan (carinan tevlihev û dijwar) pêk tînin - ew perçeyên ku ji kesek taybetî re destnîşan dikin jê dikin. Mînakî, rû û hejmarên di wêneyan de têne jêbirin an nayên xwendin. Wekî din, ji bo ku databas ne tenê ji her kesî re peyda bibe, lê di nav zanyaran de bibe standardek ku li ser berhevkirina ramanan rehet e, pêdivî ye ku ne tenê ew were weşandin, lê di heman demê de gotarek jêderkirî ya cihê jî were nivîsandin. ew û avantajên wê.

Dema ku di mijara ku tê lêkolîn kirin de daneyên vekirî tune ne xirabtir e. Wê hingê vekoler tenê dikare encamên ku ji hêla nivîskar ve li ser baweriyê têne pêşkêş kirin qebûl bike. Ji hêla teorîkî ve, nivîskar dikaribû wan jî zêde binirxîne û nedîtî bimîne, lê di hawîrdorek akademîk de ev ne mimkûn e, ji ber ku ew li dijî daxwaza pirraniya zanyaran a pêşxistina zanistê derdikeve.

Di gelek warên ML de, di nav de dîtina komputerê, di heman demê de gelemperî ye ku girêdan bi kodê (bi gelemperî GitHub) bi gotaran ve girêdin. Gotar bixwe jî kodek pir hindik dihewîne an jî pseudokod in. Û li vir, dîsa, heke gotar ji hêla lêkolînerek ji pargîdaniyek, û ne ji zanîngehê ve hatî nivîsandin, dijwarî derdikevin. Bi xwerû, koda ku di pargîdaniyek an destpêkek de hatî nivîsandin NDA tête navnîş kirin. Lekolînwan û hevkarên wan neçar in ku pir bixebitin da ku koda girêdayî ramana ku ji depoyên hundurîn û bê guman girtî veqetînin veqetînin.

Derfeta weşanê jî bi girîngiya mijara hilbijartî ve girêdayî ye. Têkilî bi piranî ji hêla hilber û karûbaran ve tê destnîşankirin: heke pargîdaniyek an destpêkek eleqedar e ku li ser bingeha ramanek ji gotarek karûbarek nû ava bike an karûbarek heyî baştir bike, ew zêdeyek e.

Xelata bi navê Ilya Segalovich. Çîrokek li ser zanistiya computer û weşanên destpêkirinê

Wekî ku berê hatî behs kirin, kaxezên zanistiya computer kêm kêm bi tenê têne nivîsandin. Lê wekî qaîdeyek, yek ji nivîskaran ji yên din bêtir dem û hewl dide. Tevkariya wî ya nûjeniya zanistî ya herî mezin e. Di navnîşa nivîskaran de, yekem kesek weha tête destnîşan kirin - û di pêşerojê de, dema ku behsa gotarek bikin, ew tenê dikarin behsa wî bikin (mînak, "Ivanov et al" - "Ivanov û yên din" ji latînî hatine wergerandin). Lêbelê, tevkariyên kesên din jî pir bi qîmet in - wekî din ne gengaz e ku meriv di navnîşa nivîskaran de be.

pêvajoya Review

Kaxez bi gelemperî çend meh beriya konferansê nayê pejirandin. Piştî ku gotarek tê şandin, lêkolîner 3-5 hefte hene ku wê bixwînin, binirxînin û şîrove bikin. Ev yek li gorî pergala yek kor dibe, dema ku nivîskar navên rexnegiran nabînin, an jî du kor, dema ku rexnegir bixwe navên nivîskaran nabînin. Vebijarka duyemîn bêtir bêalî tê hesibandin: gelek gotarên zanistî destnîşan kirin ku populerbûna nivîskar bandorê li biryara nirxandêr dike. Mînakî, ew dikare bihesibîne ku zanyarek bi hejmareke mezin ji gotarên ku berê hatine weşandin, a priori hêjayî nirxek bilind e.

Digel vê yekê, tewra di bûyera korbûna dualî de jî, ger ku di heman qadê de bixebite, nirxdêr dê nivîskar texmîn bike. Wekî din, di dema lêkolînê de, dibe ku gotar berê di databasa arXiv de, mezintirîn depoya kaxezên zanistî, were weşandin. Organîzatorên konferansê vê yekê qedexe nakin, lê ew pêşniyar dikin ku di weşanan de ji bo arXiv sernavek cûda û kurteyek cûda bikar bînin. Lê heke gotar li wir hate şandin, ew ê dîsa jî ne dijwar be ku wê bibîne.

Her gav gelek lêkolîner hene ku gotarek dinirxînin. Yek ji wan rola meta-nirxanderê tê destnîşankirin, ku divê tenê biryarên hevkarên xwe binirxîne û biryara dawî bide. Ger lêkolîner li ser gotarê nerazî bin, meta-reviewer jî dikare wê ji bo bêkêmasî bixwîne.

Carinan, piştî nirxandina nirxandin û şîroveyan, derfeta nivîskar heye ku bi rexnegir re bikeve nav nîqaşê; tewra derfetek heye ku wî razî bike ku biryara xwe biguhezîne (lêbelê, pergalek weha ji bo hemî konferansan kar nake, û hîn kêmtir gengaz e ku bi ciddî bandorek li ser biryarê bike). Di nîqaşê de, hûn nekarin ji karên zanistî yên din re vebêjin, ji bilî yên ku berê di gotarê de hatine destnîşan kirin. Hûn dikarin tenê "alîkariya" nirxandêr bikin ku naveroka gotarê baştir fam bike.

Xelata bi navê Ilya Segalovich. Çîrokek li ser zanistiya computer û weşanên destpêkirinê

Konferans û kovar

Gotarên zanistiya kompîturê pir caran ji kovarên zanistî re ji konferansan re têne şandin. Ev e ji ber ku weşanên kovarê xwedî daxwazên ku ji wan re dijwartir in hene, û pêvajoya nirxandina peer dikare bi mehan an jî salan bidome. Zanistiya komputerê qadek pir bilez e, ji ber vê yekê nivîskar bi gelemperî ne amade ne ku ew qas dirêj li benda weşanê bisekinin. Lêbelê, gotarek ku jixwe ji bo konferansê hatî pejirandin dikare wê hingê were zêdekirin (mînak, bi pêşkêşkirina encamên berfirehtir) û di kovarek ku qedexeyên cîhê ne ew qas hişk in were weşandin.

Bûyerên di konferansê de

Forma amadebûna nivîskarên gotarên pejirandî di konferansê de ji hêla nirxandaran ve tê destnîşankirin. Ger gotar ronahiya kesk were dayîn, wê hingê hûn bi gelemperî stendek poster têne veqetandin. Poster slaytek statîk e ku bi kurteya gotarê û nîgaran tê de heye. Hin odeyên konferansê bi rêzên dirêj ên standên posterê tije ne. Nivîskar beşek girîng ji dema xwe li nêzî posterê xwe derbas dike, bi zanyarên ku bi gotarê re eleqedar in re danûstendinê dike.

Xelata bi navê Ilya Segalovich. Çîrokek li ser zanistiya computer û weşanên destpêkirinê

Xelata bi navê Ilya Segalovich. Çîrokek li ser zanistiya computer û weşanên destpêkirinê

Vebijarkek hinekî bi prestîjtir ji bo beşdarbûnê axaftinek birûskê ye. Ger vekoler gotarê hêjayî raporek bilez bihesibînin, nivîskar bi qasî sê deqeyan tê dayîn ku ji temaşevanek berfireh re biaxive. Ji aliyekî ve, axaftinek birûskê fersendek baş e ku hûn li ser ramana xwe ne tenê ji kesên ku bi însiyatîfa xwe bi posterê re eleqedar bûne re vebêjin. Ji hêla din ve, mêvanên posterê yên proaktîf ji guhdarên navîn ên li salonê bêtir amade ne û di mijara weya taybetî de pirtir in. Ji ber vê yekê, di raporek bilez de, hûn hîn jî hewce ne ku wextê we hebe ku mirovan nûve bikin.

Xelata bi navê Ilya Segalovich. Çîrokek li ser zanistiya computer û weşanên destpêkirinê

Bi gelemperî, di dawiya axaftina xwe ya birûskê de, nivîskar jimareya posterê bi nav dikin da ku guhdar karibin wê bibînin û gotarê çêtir fam bikin.

Xelata bi navê Ilya Segalovich. Çîrokek li ser zanistiya computer û weşanên destpêkirinê

Vebijarka paşîn, ya herî bi prestîj, posterek e û pêşandanek tam a ramanê ye, dema ku êdî ji bo vegotina çîrokê ne hewce ye ku bilezînin.

Xelata bi navê Ilya Segalovich. Çîrokek li ser zanistiya computer û weşanên destpêkirinê

Lê bê guman, zanyar - tevî nivîskarên gotarên pejirandî - ne tenê ji bo ku xwe nîşan bidin têne konferansa din. Pêşîn, ew ji ber sedemên diyar meyl dikin ku posterên bi qada xwe ve girêdayî bibînin. Û ya duyemîn, ji bo wan girîng e ku navnîşa têkiliyên xwe ji bo mebesta xebata akademîk a hevbeş di pêşerojê de berfireh bikin. Ev ne nêçîr e - an jî, bi kêmanî, qonaxa wê ya yekem e, ku bi kêmanî li dû hev danûstendina raman, pêşkeftin û xebata hevbeş a li ser yek an çend gotaran tê.

Di heman demê de, tora hilberîner a di konferansek jorîn de ji ber kêmbûna tevahî dema vala dijwar e. Ger, piştî rojek tevahî ku di pêşkêşiyan de û di nîqaşên li ser posteran de derbas kir, zanyar hêza xwe parastiye û berê xwe da jet derengiyê, wê hingê ew diçe yek ji gelek partiyan. Ew ji hêla pargîdaniyan ve têne mêvandar kirin - ji ber vê yekê, partî bi gelemperî xwedan karakterek nêçîrê ne. Di heman demê de, gelek mêvan wan qet ne ji bo dîtina karekî nû, lê dîsa, ji bo torê bikar tînin. Di êvarê de êdî rapor û poster tune - "girtina" pisporê ku hûn jê re eleqedar in hêsantir e.

Xelata bi navê Ilya Segalovich. Çîrokek li ser zanistiya computer û weşanên destpêkirinê

Ji ramanê heya hilberînê

Zanistiya komputerê yek ji wan çend pîşesaziyên ku berjewendîyên pargîdanî û destpêkan bi hawîrdora akademîk ve girêdayî ne. NIPS, ICML û konferansên din ên bi vî rengî, ne tenê ji zanîngehan, ji pîşesaziyê gelek kesan dikişînin. Ev ji bo qada zanistiya komputerê tîpîk e, lê berevajî ji bo piraniya zanistên din.

Ji hêla din ve, ne hemî ramanên ku di gotaran de têne pêşkêş kirin tavilê ber bi afirandina an çêtirkirina karûbaran ve diçin. Tewra di hundurê pargîdaniyek de, lêkolînerek dikare ji hevkarên karûbarê ramanek ku ji hêla standardên zanistî ve pêşkeftî ye pêşniyar bike û ji ber çend sedeman redkirina pêkanîna wê bistîne. Yek ji wan berê li vir hatî behs kirin - ev cûdahiya daneyên "akadîmî" ya ku gotar li ser hatî nivîsandin û daneya rastîn e. Wekî din, dibe ku pêkanîna ramanek dereng bimîne, hewceyê gelek çavkaniyan hewce bike, an bi bihayê xirabkirina metrîkên din tenê nîşanek çêtir bike.

Xelata bi navê Ilya Segalovich. Çîrokek li ser zanistiya computer û weşanên destpêkirinê

Rewş ji ber vê yekê xilas dibe ku gelek pêşdebir bi xwe hinekî lêkolîner in. Ew beşdarî konferansan dibin, bi akademîsyenan re bi heman zimanî diaxivin, ramanan pêşniyar dikin, carinan beşdarî çêkirina gotaran dibin (mînak nivîsandina kodê), an jî bi xwe jî wekî nivîskar tevdigerin. Ger pêşdebirek di pêvajoya akademîk de bişopîne, tiştê ku di beşa lêkolînê de diqewime dişopîne, bi gotinek - heke ew tevgerek dijberî li hember zanyaran nîşan bide, wê hingê çerxa zivirandina ramanên zanistî di kapasîteyên karûbarê nû de kurt dibe.

Em ji hemû lêkolînerên ciwan re serkeftin û serkeftinên mezin di karê wan de dixwazin. Ger vê postê tiştek nû ji we re negotibe, wê hingê dibe ku we berê li konferansek jorîn weşandibe. Ji bo qeydkirinê xelat xwe û çavdêrên zanistî destnîşan bikin.

Source: www.habr.com

Add a comment