Bernameya Niştecîh ya Yandex, an Çawa Backenderek Ezmûnî Dikare Bibe Endezyarek ML

Bernameya Niştecîh ya Yandex, an Çawa Backenderek Ezmûnî Dikare Bibe Endezyarek ML

Yandex di fêrbûna makîneyê de ji bo pêşdebirên paşîn ên xwedî ezmûn bernameyek rûniştinê vedike. Ger we di C++/Python de pir nivîsandibe û hûn dixwazin vê zanînê li ML-ê bicîh bikin, wê hingê em ê fêrî we bikin ka hûn çawa lêkolîna pratîkî bikin û şêwirmendên xwedî ezmûn peyda bikin. Hûn ê li ser karûbarên sereke yên Yandex bixebitin û di warên wekî modelên xêz û zêdekirina gradient, pergalên pêşniyarê, torên neuralî yên ji bo analîzkirina wêne, nivîs û deng de jêhatîbûnê bistînin. Her weha hûn ê fêr bibin ka meriv çawa modelên xwe bi karanîna metrîkên offline û serhêl bi rêkûpêk binirxîne.

Demjimêra bernameyê salek e, di wê de beşdar dê di beşa îstîxbarata makîneyê û lêkolînê ya Yandex de bixebitin, û hem jî beşdarî ders û semîneran bibin. Tevlêbûn bi pere ye û bi xebata tam-time ve girêdayî ye: 40 demjimêr her hefte, ji 1ê Tîrmeha îsal dest pê dike. Serlêdan niha vekirî ne û wê heta 1ê Gulanê bidome. 

Û naha bi hûrgulî - li ser kîjan celeb temaşevanan em li benda çi ne, dê pêvajoya xebatê çi be û, bi gelemperî, ka meriv çawa pisporek paşerojê dikare di ML-yê de kariyera xwe bike.

Directivity

Gelek pargîdaniyan Bernameyên Niştecîhbûnê hene, wekî mînak, Google û Facebook. Ew bi giranî ji pisporên ciwan û navîn-asta ku hewl didin ku gavekê berbi lêkolîna ML-ê bavêjin têne armanc kirin. Bernameya me ji bo temaşevanên cuda ye. Em pêşdebirên paşerojê vedixwînin ku jixwe têra xwe ezmûnek bi dest xistine û bê guman dizanin ku di jêhatîyên xwe de ew hewce ne ku ber bi ML-yê ve biçin, da ku di çareserkirina pirsgirêkên fêrbûna makîneya pîşesaziyê de jêhatîyên pratîkî - û ne jêhatîyên zanyarek- bidest bixin. Ev nayê wê wateyê ku em piştgiriyê nadin lêkolînerên ciwan. Me ji wan re bernameyeke cuda amade kiriye - xelat bi navê Ilya Segalovich, ku di heman demê de dihêle hûn di Yandex de bixebitin.

Niştecîh dê li ku derê bixebite?

Di Beşa Îstixbarat û Lêkolînê ya Makîneyê de, em bixwe ramanên projeyê pêş dixin. Çavkaniya sereke ya îlhamê wêjeya zanistî, gotar û meylên di civata lêkolînê de ye. Ez û hevkarên xwe tiştên ku em dixwînin analîz dikin, lê dinêrin ka em çawa dikarin rêbazên ku ji hêla zanyaran ve têne pêşniyar kirin çêtir bikin an berfireh bikin. Di heman demê de, her yek ji me qada zanîn û berjewendîyên xwe dihesibîne, li gorî qadên ku ew girîng dibîne, peywirê formule dike. Fikra projeyek bi gelemperî di çarçoweya encamên lêkolîna derveyî û jêhatîyên xwe de çêdibe.

Ev pergal baş e ji ber ku ew bi piranî pirsgirêkên teknolojîk ên karûbarên Yandex jî berî ku ew derkevin çareser dike. Dema ku karûbarek bi pirsgirêkek re rû bi rû bimîne, nûnerên wê têne cem me, bi îhtîmalek mezin ku teknolojiyên ku me berê amade kirine bigirin, ku ya ku dimîne ev e ku meriv di hilberê de rast were sepandin. Ger tiştek ne amade be, em ê bi kêmanî zû bi bîr bînin ku em dikarin "dest bi kolandinê" bikin û di kîjan gotaran de li çareseriyê bigerin. Wekî ku em dizanin, nêzîkatiya zanistî ew e ku li ser milên dêw raweste.

Çi bikin

Li Yandex - û tewra bi taybetî di rêveberiya me de - hemî deverên têkildar ên ML têne pêşve xistin. Armanca me ev e ku em kalîteya cûrbecûr hilberan baştir bikin, û ev wekî teşwîqek ji bo ceribandina her tiştê nû xizmet dike. Wekî din, karûbarên nû bi rêkûpêk xuya dibin. Ji ber vê yekê bernameya dersê di pêşkeftina pîşesaziyê de hemî qadên sereke (baş îsbatkirî) yên fêrbûna makîneyê dihewîne. Dema ku beşa xwe ya qursê berhev kir, min ezmûna xwe ya mamostetiyê li Dibistana Analîzkirina Daneyan, û her weha materyal û xebata mamosteyên din ên SHAD bikar anî. Ez dizanim ku hevalên min jî heman tişt kirin.

Di mehên pêşîn de, perwerdehiya li gorî bernameya qursê dê bi qasî 30% ji dema xebata we bigire, paşê jî 10%. Lêbelê, girîng e ku meriv fêm bike ku xebata bi modelên ML-ê bixwe dê bi qasî çar carî ji hemî pêvajoyên têkildar kêmtir bigire. Di nav wan de amadekirina paşîn, wergirtina daneyan, nivîsandina boriyek ji bo pêş-pêvajoya wê, xweşbînkirina kodê, adaptasyona bi hardware taybetî, hwd. Endezyarek ML, heke hûn bixwazin, pêşdebirek tije-stack e (tenê bi giraniyek mezintir li ser fêrbûna makîneyê) , dikare pirsgirêkek ji destpêkê heya dawiyê çareser bike. Tewra bi modelek amadekirî re, dibe ku hûn hewce ne ku hejmareke bêtir çalakiyan bikin: pêkanîna wê di nav çend makîneyan de paralel bikin, pêkanînek di forma destek, pirtûkxane, an pêkhateyên karûbarê bixwe de amade bikin.

Hilbijartina xwendekar
Ger hûn di bin wê yekê de bûn ku çêtir e ku hûn bibin endezyarek ML-ê ku pêşî wekî pêşdebirek paşverû bixebitin, ev ne rast e. Qeydkirina di heman SAD-ê de bêyî ezmûnek rastîn di pêşxistina karûbaran de, fêrbûn û pir daxwazî ​​​​bûna li sûkê vebijarkek hêja ye. Gelek pisporên Yandex bi vî rengî di pozîsyonên xwe yên heyî de bi dawî bûn. Ger pargîdaniyek amade ye ku tavilê piştî mezûnbûnê di warê ML de karekî pêşkêşî we bike, dibe ku hûn pêşniyarê jî qebûl bikin. Hewl bidin ku bi şêwirmendek bi ezmûn re têkevin tîmek baş û amade bibin ku pir tiştan fêr bibin.

Bi gelemperî çi ji we re dibe asteng ku hûn ML bikin?

Ger paşvekêşek bixwaze bibe endezyarek ML, ew dikare ji du warên pêşkeftinê hilbijêrin - bêyî ku bernameya rûniştinê li ber çavan bigire.

Pêşîn, wekî beşek hin qursek perwerdehiyê bixwînin. Dersan Coursera dê we nêzikî têgihîştina teknîkên bingehîn bike, lê ji bo ku hûn di nav pîşeyê de bi qasî têra xwe têr bibin, hûn hewce ne ku pir wextê wê bidin. Mînakî, ji SAD mezûn bibe. Bi salan, ShAD hejmarek cûda qurs rasterast li ser fêrbûna makîneyê hebû - bi navînî, bi qasî heşt. Her yek ji wan bi rastî girîng û bikêr e, tevî nerîna mezûnan. 

Ya duyemîn, hûn dikarin beşdarî projeyên şer bibin ku hûn hewce ne ku yek an algorîtmayek ML-ya din bicîh bînin. Lêbelê, li ser bazara pêşkeftina IT-ê pir hindik projeyên weha hene: fêrbûna makîneyê di pir karan de nayê bikar anîn. Tewra di bankên ku bi aktîvî fersendên têkildar ên ML-yê dikolin, tenê çend kes bi analîzkirina daneyê re mijûl dibin. Ger we nikarîbû beşdarî yek ji van tîmê bibin, vebijarka we tenê ev e ku hûn projeya xwe bidin dest pê kirin (ku, bi îhtîmalek mezin, hûn ê muhletên xwe diyar bikin, û ev yek hindik e ku bi karên hilberîna şer re têkildar be), an jî dest bi pêşbaziyê bikin. Kaggle.

Bi rastî, bi endamên din ên civatê re bibin yek û xwe di pêşbaziyan de biceribînin nisbeten hêsan - Bi taybetî jî heke hûn jêhatîbûna xwe bi perwerdehiyê û qursên navborî yên li ser Coursera piştguh bikin. Her pêşbaziyek demek heye - ew ê ji we re bibe teşwîqek û we di pargîdaniyên IT-ê de ji bo pergalek wekhev amade bike. Ev rêyek baş e - ku, lêbelê, ji pêvajoyên rastîn jî piçekî veqetandî ye. Li ser Kaggle daneya pêş-pêvajokirî, her çend ne her gav bêkêmasî, ji we re tê dayîn; pêşniyar nekin ku hûn li ser beşdariya hilberê bifikirin; û ya herî girîng jî, ew hewceyî çareseriyên guncan ji bo hilberînê ne. Algorîtmayên we belkî dê bixebitin û pir rast bin, lê model û koda we dê mîna Frankenstein ji beşên cihêreng bi hev ve girêbide - di projeyek hilberînê de, tevahî avahî dê pir hêdî bixebite, nûvekirin û berfirehkirin dê dijwar be (mînak, Algorîtmayên ziman û deng dê her dem bi qismî ji nû ve werin nivîsandin her ku ziman pêşve diçe). Pargîdanî bi vê yekê re eleqedar in ku xebata ku hatî navnîş kirin ne tenê ji hêla we bixwe ve were kirin (zelal e ku hûn, wekî nivîskarê çareseriyê, dikarin vê yekê bikin), lê her weha ji hêla her hevkarên we ve jî. Cûdahiya di navbera bernameya werzîş û pîşesaziyê de tê nîqaş kirin много, û Kaggle bi rastî "werzişvanan" perwerde dike - hetta ku ew pir baş dike, dihêle ku ew hin ezmûnan bi dest bixin.

Min du xetên gengaz ên pêşveçûnê diyar kir - perwerdehiya bi bernameyên perwerdehiyê û perwerdehiya "di şer de", mînakî li ser Kaggle. Bernameya rûniştinê ji van her du rêbazan têkeliyek e. Ders û semînerên li ser asta ŞAD, û her weha projeyên bi rastî şerker, li benda we ne.

Source: www.habr.com

Add a comment