Yandex Resident Program, ama sida dib-u-dejiye khibrad leh uu u noqon karo injineer ML

Yandex Resident Program, ama sida dib-u-dejiye khibrad leh uu u noqon karo injineer ML

Yandex waxa ay u furaysaa barnaamijka degenaanshaha mashiinka barashada mashiinada ee horumariyayaal khibrad leh. Haddii aad wax badan ku qortay C ++/Python oo aad rabto inaad aqoontan ku dabaqdo ML, markaa waxaanu ku bari doonaa sida loo sameeyo cilmi-baaris wax ku ool ah oo aan ku siinno lataliyeyaal khibrad leh. Waxaad ka shaqayn doontaa adeegyada muhiimka ah ee Yandex oo waxaad ka heli doontaa xirfado meelaha ay ka midka yihiin moodooyinka toosan iyo kor u qaadista tartiib tartiib ah, nidaamyada talada, shabakadaha neural ee falanqaynta sawirada, qoraalka iyo codka. Waxa kale oo aad baran doontaa sida saxda ah ee loo qiimeeyo moodooyinkaaga adiga oo isticmaalaya metrik offline iyo online.

Muddada barnaamijku waa hal sano, kaas oo kaqeybgalayaashu ay ka shaqeyn doonaan sirdoonka mashiinka iyo waaxda cilmi-baarista ee Yandex, iyo sidoo kale inay ka qaybgalaan casharro iyo siminaaro. Ka qaybqaadashada waa lacag waxayna ku lug leedahay shaqo waqti-buuxa ah: 40 saacadood todobaadkii, laga bilaabo Luulyo 1 ee sanadkan. Codsiyada hadda waa furan yihiin waxayna socon doontaa ilaa 1-da May. 

Oo hadda si faahfaahsan - oo ku saabsan nooca dhagaystayaasha aan sugeyno, habka shaqadu waxay noqon doontaa iyo, guud ahaan, sida khabiirka dhabarka u bedeli karo xirfadda ML.

Diirada saar

Shirkado badan ayaa leh Barnaamijyada degenaanshaha, oo ay ku jiraan, tusaale ahaan, Google iyo Facebook. Inta badan waxaa loogu talagalay khubarada da'da yar iyo kuwa dhexe kuwaas oo isku dayaya inay qaadaan tallaabo dhanka cilmi-baarista ML. Barnaamijkeena waxa loogu talagalay dhagaystayaal kala duwan. Waxaan ku casumaynaa horumariyayaal hore u helay waayo-aragnimo ku filan oo og hubaal in kartidooda ay u baahan yihiin inay u wareegaan ML, si ay u helaan xirfado wax ku ool ah - oo aan ahayn xirfadaha saynisyahanka - xallinta dhibaatooyinka barashada mashiinka warshadaha. Tani macnaheedu maaha inaanan taageerin cilmi-baarayaasha da'da yar. Waxa aanu u qabanqaabinay barnaamij gooni ah. premium Magaca Ilya Segalovich, kaas oo sidoo kale kuu ogolaanaya inaad ka shaqeyso Yandex.

Halkee ayuu ka shaqayn doonaa qofka degan?

Waaxda Sirdoonka iyo Cilmi-baarista Mashiinka, anaga lafteena waxaan horumarinaa fikradaha mashruuca. Isha ugu muhiimsan ee dhiirigelinta waa suugaanta sayniska, maqaallada, iyo isbeddellada bulshada cilmi-baarista. Aniga iyo asxaabteyda ayaa falanqeynaya waxa aan akhrino, anagoo eegayna sida aan u hagaajin karno ama u ballaarin karno hababka ay soo jeediyaan saynisyahano. Isla markaana mid kasta oo inaga mid ahi uu ku xisaabtamayo goobtiisa aqooneed iyo danihiisa, waxa uu hawsha u dejiyaa meelaha uu u arko inay muhiim yihiin. Fikirka mashruucu wuxuu inta badan ku dhashaa isgoysyada natiijooyinka cilmi baarista dibadda iyo kartida qofka.

Nidaamkani waa mid wanaagsan sababtoo ah wuxuu si weyn u xalliyaa dhibaatooyinka tignoolajiyada ee adeegyada Yandex xitaa ka hor intaysan soo bixin. Marka adeegi uu la kulmo dhibaato, wakiilladiisu way noo yimaadaan, waxay u badan tahay inay qaataan tignoolajiyada aan hore u diyaarinay, taas oo dhammaan waxa hadhay ay tahay in si sax ah loogu dabaqo badeecada. Haddii wax aan diyaar ahayn, waxaan ugu yaraan si dhakhso ah u xasuusan doonaa meesha aan "bilaaban karno qodista" iyo maqaallada lagu raadinayo xalka. Sida aynu ognahay, habka sayniska waa in lagu istaago garbaha Rafaa.

Maxaa la sameeyaa

Yandex - iyo xitaa gaar ahaan maamulkayaga - dhammaan meelaha ku habboon ee ML ayaa la soo saarayaa. Hadafkayagu waa inaanu hagaajino tayada badeecadaha kala duwan, tani waxay u adeegtaa sidii dhiirigelin si loo tijaabiyo wax kasta oo cusub. Intaa waxaa dheer, adeegyo cusub ayaa si joogto ah u muuqda. Markaa barnaamijka muxaadaraadka waxa uu ka kooban yahay dhammaan qaybaha muhiimka ah (si wanaagsan loo xaqiijiyay) ee barashada mashiinka ee horumarinta warshadaha. Markii aan ururinayo qaybtayda koorsada, waxaan adeegsaday khibradayda waxbarid ee Dugsiga Falanqaynta Xogta, iyo sidoo kale agabka iyo shaqada macalimiinta kale ee SHAD. Waan ogahay in asxaabteyda ay sidaas oo kale sameeyeen.

Bilaha ugu horreeya, tababarka sida ku cad barnaamijka koorsada ayaa ku xisaabtami doona ku dhawaad ​​30% wakhtigaaga shaqada, ka dibna ilaa 10%. Si kastaba ha ahaatee, waxaa muhiim ah in la fahmo in la shaqaynta moodooyinka ML laftoodu ay sii wadi doonaan qaadashada ku dhawaad ​​afar jeer in ka yar dhammaan hababka la xidhiidha. Kuwaas waxaa ka mid ah diyaarinta dhabarka, helitaanka xogta, qorista dhuumaha si loogu sii diyaariyo, hagaajinta koodka, la qabsiga qalab gaar ah, iwm. Injineer ML waa, haddii aad rabto, horumariye buuxa (kaliya oo xoogga saaraya barashada mashiinka) , karti u leh xallinta dhibaatada bilow ilaa dhamaad. Xataa iyada oo leh qaab diyaarsan, waxa ay u badan tahay in aad u baahan doonto in aad samayso dhawr ficil oo dheeraad ah: barbar-dhig fulinteeda mashiinno kala duwan, diyaari dhaqangelinta qaab gacan-qabasho ah, maktabad, ama qaybaha adeegga laftiisa.

Doorashada ardayga
Haddii aad ku hoos jirtay aragtida ah in ay fiican tahay in aad noqoto injineer ML adiga oo marka hore u shaqeeya sidii horumariye dhabarka ah, tani run maaha. Isku-diiwaangelinta isla SHAD-da adiga oo aan lahayn waayo-aragnimo dhab ah oo ku saabsan horumarinta adeegyada, barashada iyo noqoshada baahida aadka ah ee suuqa ayaa ah ikhtiyaar aad u wanaagsan. Qaar badan oo ku takhasusay Yandex ayaa sidan ku dhameystay boosaskooda hadda. Haddii shirkad kastaa ay diyaar u tahay inay ku siiso shaqo ku saabsan ML isla markiiba ka dib qalin-jabinta, waa inaad sidoo kale aqbashaa deeqda. Isku day inaad la gasho koox wanaagsan oo leh lataliye khibrad leh oo u diyaargarow inaad wax badan barato.

Maxaa inta badan kaa hor istaaga inaad samayso ML?

Haddii qofka dhabarka ka dambeeya uu damco inuu noqdo injineer ML, wuxuu ka dooran karaa laba qaybood oo horumarineed - isagoon xisaabta ku darsan barnaamijka degenaanshaha.

Marka hore, wax u baro iyada oo qayb ka ah koorsada waxbarasho. Casharrada Coursera waxay kuu soo dhowaan doontaa inaad fahamto farsamooyinka aasaasiga ah, laakiin si aad naftaada u geliso xirfadda ilaa xad kugu filan, waxaad u baahan tahay inaad waqti badan geliso. Tusaale ahaan, ka qalin jabiyay SHAD. Sanadihii la soo dhaafay, SHAD waxay lahayd tiro koorasyo ​​kala duwan oo toos ah oo ku saabsan barashada mashiinka - celcelis ahaan, ilaa siddeed. Mid kasta oo iyaga ka mid ah runtii waa muhiim oo faa'iido leh, oo ay ku jiraan ra'yiga qalin-jabinta. 

Marka labaad, waxaad ka qayb qaadan kartaa mashaariicda dagaalka halkaas oo aad u baahan tahay inaad hirgeliso hal ama mid kale oo ML algorithm. Si kastaba ha ahaatee, waxaa jira mashruucyo aad u yar oo ku saabsan suuqa horumarinta IT: barashada mashiinka looma isticmaalo inta badan hawlaha. Xitaa bangiyada si firfircoon u sahaminaya fursadaha la xiriira ML, kaliya in yar ayaa ku hawlan falanqaynta xogta. Haddii aadan awoodin inaad ku biirto mid ka mid ah kooxahan, ikhtiyaarka kaliya ayaa ah inaad bilowdo mashruucaaga (halkaas, ay u badan tahay, waxaad dejin doontaa waqtiyadaada kama dambaysta ah, tanina wax yar ayay ku leedahay hawlaha wax soo saarka ee dagaalka), ama bilaw inaad ku tartanto Kaggle.

Runtii, la midow xubnaha kale ee bulshada oo isku day naftaada tartamada yara fudud - gaar ahaan haddii aad ku taageerto xirfadahaaga tababar iyo koorsooyinka lagu sheegay Coursera. Tartan kastaa wuxuu leeyahay waqti kama dambays ah - waxay kuu noqon doontaa dhiirigelin waxayna kuu diyaarin doontaa nidaam la mid ah shirkadaha IT-ga. Tani waa hab wanaagsan - taas oo, si kastaba ha ahaatee, sidoo kale waa wax yar oo laga furay hababka dhabta ah. On Kaggle waxaa lagu siinayaa horay loo sii shaqeeyay, in kasta oo aan had iyo jeer kaamil ahayn, xogta; ha bixinin inaad ka fikirto wax ku biirinta alaabta; iyo tan ugu muhiimsan, uma baahna xalal ku habboon wax soo saarka. Algorithms-yadaadu waxay u badan tahay inay shaqeeyaan oo ay noqdaan kuwo sax ah, laakiin moodooyinkaaga iyo koodkaagu waxay noqon doonaan sida Frankenstein oo la isku tolay qaybo kala duwan - mashruuca wax soo saarka, qaabka oo dhan wuxuu u shaqeyn doonaa si tartiib tartiib ah, way adkaan doontaa in la cusbooneysiiyo oo la ballaariyo (tusaale ahaan, algorithms-ka luqadda iyo codka mar walba qayb ahaan dib ayaa loo qori doonaa marka uu afku horumaro). Shirkaduhu waxay xiiseynayaan xaqiiqda ah in shaqada liiska ku qoran la samayn karo oo keliya adiga qudhaadu ( way caddahay in adiga, qoraaga xalka, aad tan samayn karto), laakiin sidoo kale mid ka mid ah asxaabtaada. Farqiga u dhexeeya barnaamijyada isboortiga iyo warshadaha ayaa laga hadlayaa ΠΌΠ½ΠΎΠ³ΠΎ, iyo Kaggle si sax ah wax u baro "ciyaartoyda" - xitaa haddii ay si fiican u qabato, taas oo u oggolaanaysa inay helaan xoogaa khibrad ah.

Waxaan ku tilmaamay laba khadadka suurtagalka ah ee horumarinta - tababarka iyada oo loo marayo barnaamijyada waxbarashada iyo tababarka "dagaalka", tusaale ahaan Kaggle. Barnaamijka degenaanshuhu waa isku darka labadan hab. Muxaadarooyinka iyo siminaarada heerka SHAD, iyo sidoo kale mashruucyo dagaal oo dhab ah, ayaa ku sugaya.

Source: www.habr.com

Add a comment