Hadron Collider weyn iyo Odnoklassniki

Sii wadida mawduuca tartamada barashada mishiinada ee HabrΓ©, waxaan jeclaan lahayn inaan u bandhigno akhristayaasha laba goobood oo kale. Dhab ahaantii ma aha kuwo aad u weyn sida kaggle, laakiin hubaal waxay mudan yihiin feejignaan.

Hadron Collider weyn iyo Odnoklassniki

Shakhsi ahaan, aad uma jecli kaggle dhowr sababood dartood:

  • Marka hore, tartammada halkaas ka dhacaa badanaa waxay socdaan dhowr bilood, ka qaybqaadashada firfircoonina waxay u baahan tahay dadaal badan;
  • Marka labaad, kernels dadweynaha (xalalka dadweynaha). Kuwa raacsan Kaggle waxay kugula talinayaan inay ku daaweeyaan xasilloonida suufiyada Tibetan, laakiin dhab ahaantii waa wax laga xishoodo marka wax aad ka shaqeyneysay bil ama laba bilood si lama filaan ah u soo baxdo in lagu dhejiyo saxan lacag ah qof walba.

Nasiib wanaag, tartamada barashada mashiinka ayaa lagu qabtaa goobo kale, waxaana laga doodi doonaa labo ka mid ah tartamadan.

IDO SNA Hackathon 2019
Luuqadda rasmiga ah: Ingiriisi,
qabanqaabiyeyaasha: Yandex, Sberbank, HSE
Luqadda rasmiga ah ee Ruushka,
qabanqaabiyeyaasha: Kooxda Mail.ru
Wareega khadka: Janaayo 15 - Febraayo 11, 2019;
Dhamaadka Goobta: Abriil 4-6, 2019
online - laga bilaabo Febraayo 7 ilaa Maarso 15;
offline - laga bilaabo Maarso 30 ilaa Abriil 1.
Isticmaalka xog gaar ah oo ku saabsan qayb ku jirta Hadron Collider-ka weyn (habka, dardargelinta, iyo cabbirrada jireed ee kale ee adag), go'aami inay muon tahay iyo in kale
Qoraalkan, 2 hawlood ayaa la isla gartay.
- mid ka mid ah waa inaad soo dirtaa saadaashaada,
- iyo tan kale - koodhka dhamaystiran iyo qaabka saadaasha, iyo fulinta ayaa lagu soo rogay xayiraad adag oo ku saabsan wakhtiga socodsiinta iyo isticmaalka xusuusta
Tartanka SNA Hackathon, diiwaannada bandhigyada ka kooban kooxaha furan ee quudinta wararka isticmaalaha ee Febraayo-Maarso 2018 ayaa la ururiyay. Qalabka imtixaanku wuxuu ka kooban yahay usbuuca iyo badhkii ugu dambeeyay ee Maarso. Gelin kasta oo ku jira loggu wuxuu ka kooban yahay macluumaadka ku saabsan waxa la tusay iyo cidda, iyo sidoo kale sida isticmaaluhu uga falceliyay nuxurkan: qiimeeyay, faalleeyay, iska indhotiray, ama ka qariyay quudinta.
Nuxurka hawlaha SNA Hackathon waa in la qiimeeyo adeegsade kasta oo ka mid ah shabakada bulshada Odnoklassniki quudintiisa, isaga oo kor u qaadaya inta ugu badan ee suurtogalka ah qoraalladaas oo heli doona "class".
Marxaladda internetka, hawshu waxay u qaybsantay 3 qaybood:
1. u darajeeyo jagooyinka iyadoo loo eegayo sifooyinka wada shaqayneed ee kala duwan
2. darajo darajada ku salaysan sawirada ay ka kooban yihiin
3. u kala sarraysii qoraalka ay ka kooban yihiin
Halbeegga caadiga ah ee kakan, wax la mid ah ROC-AUC Celcelis ahaan ROC-AUC isticmaale ahaan
Abaalmarinnada marxaladda koowaad - Funaanadaha N, u gudubka heerka labaad, halkaas oo hoy iyo cunto lagu bixiyo intii tartanku socday.
Wajiga labaad - ??? (Sababo gaar ah dartood, maan joogin xafladda abaalmarinta mana awoodin inaan ogaado waxa abaal-marinaha ay ahaayeen ugu dambeyntii). Waxay u ballan qaadeen laptops dhammaan xubnaha kooxda guulaysata
Abaalmarinta marxaladda koowaad - funaanado loogu talagalay 100 ka qaybgalayaasha ugu fiican, marxaladda labaad, halkaas oo safarka Moscow, hoyga iyo cuntada inta lagu jiro tartanka la bixiyay. Sidoo kale, dhammaadka marxaladda koowaad, abaal-marinno ayaa lagu dhawaaqay sida ugu wanaagsan ee hawlaha 3 ee marxaladda 1: qof kastaa wuxuu ku guuleystay RTX 2080 TI video card!
Marxaladda labaad waxay ahayd heer kooxeed, kooxuhu waxay ka koobnaayeen 2 ilaa 5 qof, abaalmarinno:
Meesha 1aad - 300 rubles
Meesha 2aad - 200 rubles
Meesha 3aad - 100 rubles
Abaalmarinta xeerbeegtida - 100 rubles
Kooxda telegram-ka rasmiga ah, ~ 190 kaqeybgale, isgaarsiin Ingiriisi ah, su'aaluhu waxay sugayeen dhowr maalmood jawaabta Kooxda rasmiga ah ee telegram, ~ 1500 ka qaybgalayaasha, dood firfircoon oo ku saabsan hawlaha u dhexeeya ka qaybgalayaasha iyo qabanqaabiyeyaasha
Qabanqaabiyayaashu waxay bixiyeen laba xal oo aasaasi ah, fudud oo horumarsan. Si fudud loo baahan yahay in ka yar 16 GB ee RAM, iyo xusuusta horumarsan kuma habboona 16. Isla mar ahaantaana, in yar oo hore loo eego, ka qaybgalayaashu ma awoodaan inay si weyn uga sarreeyaan xalka sare. Ma jirin wax dhib ah markii la bilaabay xalalkan. Waa in la ogaadaa in tusaalaha horumarsan uu jiray faallo tilmaameysa meesha laga bilaabo hagaajinta xalka. Xalalka aasaasiga ah ee aasaasiga ah ayaa la bixiyay mid kasta oo ka mid ah hawlaha, kuwaas oo ay si fudud uga soo baxeen ka qaybgalayaasha. Maalmihii hore ee tartanka, kaqeybgalayaashu waxay la kulmeen dhibaatooyin dhowr ah: marka hore, xogta waxaa lagu bixiyay qaabka Apache Parquet, oo dhammaan isku-dhafka Python iyo xirmada parquet ma shaqeynin khaladaad la'aan. Dhibaatada labaad waxay ahayd in sawirada laga soo dejiyo daruuraha boostada; wakhtigan xaadirka ah ma jirto si sahlan oo loo soo dejiyo tiro badan oo xog ah hal mar. Natiijo ahaan, dhibaatooyinkani waxay dib u dhigeen ka qaybgalayaasha dhowr maalmood.

IDO. Marxaladda koowaad

Hawshu waxay ahayd in loo kala saaro walxaha muon/non-muon iyadoo loo eegayo sifooyinkooda. Tilmaamaha ugu muhiimsan ee hawshani waxay ahayd joogitaanka tiirka miisaanka ee xogta tababarka, taas oo qabanqaabiyeyaasha laftoodu ay u fasirteen kalsoonida jawaabta khadkan. Dhibaatadu waxay ahayd in dhawr saf ay ku jiraan miisaan taban.

Hadron Collider weyn iyo Odnoklassniki

Ka dib markii aan ka fikiray dhowr daqiiqo oo ku saabsan xariiqda tilmaanta (tilmaanta ayaa si fudud u soo jiidatay sifadan tiirka miisaanka) iyo dhisidda garaafka, waxaan go'aansanay inaan hubinno 3 doorasho:

1) u rogo bartilmaameedka xariiqyada leh miisaan taban (iyo miisaan si waafaqsan)
2) Miisaanka u beddel qiimaha ugu yar si ay uga soo bilowdaan 0
3) ha isticmaalin miisaanka xadhkaha

Doorashadii saddexaad ayaa noqotay tii ugu xumayd, balse labadii hore ayaa natiijadii wanaajiyay, kii ugu wacnaana waxa uu ahaa doorashada No. 1, kaas oo isla markiiba na soo gaadhsiiyay kaalinta labaad ee hadda la joogo ee hawsha koowaad iyo ta labaad.
Hadron Collider weyn iyo Odnoklassniki
Talaabadayada xigta waxay ahayd inaan dib u eegno xogta qiimayaasha maqan. Qabanqaabiyayaashu waxay na siiyeen xog hore loo tolay, halkaas oo ay jireen qiyam aad u yar oo maqan, waxaana lagu beddelay -9999.

Waxaan ka helnay qiimayaasha maqan MatchedHit_{X,Y,Z}[N] iyo MatchedHit_D{X,Y,Z}[N] tiirarka, iyo kaliya marka N=2 ama 3. Sida aan fahansanahay, qaybo ka mid ah ma dhicin gudbi dhammaan 4 qalab , oo joogsaday midkood saxanka 3aad ama 4aad. Xogta ayaa sidoo kale ka koobnayd tiirarka Lextra_{X,Y}[N], kuwaas oo sida muuqata qeexaya isla shay sida MatchedHit_{X,Y,Z}[N], laakiin isticmaalaya nooc ka baxsan. Malahan yar ayaa soo jeediyay in Lextra_{X,Y}[N] lagu bedeli karo qiyamka maqan ee MatchedHit_{X,Y,Z}[N] (oo loogu talagalay iskuduwayaasha X iyo Y kaliya). MatchedHit_Z[N] si fiican ayaa looga buuxiyay dhexdhexaadiyaha Wax-is-daba-marintaasi waxay noo ogolaatay inaan gaadhno kaalinta 1aad ee dhex dhexaadinta labada hawlood.

Hadron Collider weyn iyo Odnoklassniki

Iyadoo la tixgelinayo in aysan waxba siinin ku guuleysiga marxaladda koowaad, waan ku joojin karnaa halkaas, laakiin waan sii wadnay, sawiro sawirro qurux badan oo aan la nimid sifooyin cusub.

Hadron Collider weyn iyo Odnoklassniki

Tusaale ahaan, waxaan ogaanay in haddii aan ku dhejinno dhibcaha is-goysyada qayb kasta oo ka mid ah afarta taarikada, waxaan arki karnaa in dhibcaha ku yaal mid kasta oo ka mid ah taarikada ay u kala qaybsan yihiin 5 leydi oo leh saamiga 4 ilaa 5 oo u dhexeeya barta (0,0), iyo in Ma jiraan dhibco ku yaal leydiga koowaad.

Cabirka saxanka/ladigga 1 2 3 4 5
Saxanka 1 500h625 1000h1250 2000h2500 4000h5000 8000h10000
Saxanka 2 520h650 1040h1300 2080h2600 4160h5200 8320h10400
Saxanka 3 560h700 1120h1400 2240h2800 4480h5600 8960h11200
Saxanka 4 600h750 1200h1500 2400h3000 4800h6000 9600h12000

Markaan go'aaminnay cabbirradan, waxaan ku darnay 4 astaamood oo cusub oo qayb kasta ah - tirada leydi-xagalka ay ku kala goyso saxan kasta.

Hadron Collider weyn iyo Odnoklassniki

Waxaan sidoo kale ogaanay in qaybuhu ay u muuqdaan inay u kala firdhiyaan dhinacyada ka soo jeeda xarunta oo fikraddu waxay kacday si ay u qiimeeyaan "tayada" kala firdhintan. Fikrad ahaan, waxay u badan tahay inay suurtogal tahay in la yimaado nooc ka mid ah "ku habboon" parabola iyadoo ku xiran meesha laga saarayo oo la qiyaaso ka leexashada, laakiin waxaan nafteena ku koobnay khadka tooska ah "ku habboon". Ka dib markii aan u dhisnay xariiq toosan oo ku habboon meel kasta oo laga soo galo, waxaan awoodnay inaan xisaabinno jaangooyooyinka caadiga ah ee jihada qayb kasta oo ka timid xariiqan toosan. Maadaama celceliska leexashada bartilmaameedka = 1 uu ahaa 152, bartilmaameedka = 0 uu ahaa 390, waxaan si ku meel gaadh ah u qiimaynay sifadan mid wanaagsan. Oo runtii, qaabkani wuxuu isla markiiba ka dhigay mid ka mid ah kuwa ugu faa'iidada badan.

Waan ku faraxsanahay oo waxaan ku darnay leexinta dhammaan 4-ta dhibcood ee isgoysyada qayb kasta oo ka soo jeeda xariiqda toosan ee qumman sida 4 dheeraad ah (sidoo kale waxay si fiican u shaqeeyeen).

Xiriirinta maqaallada sayniska ee mawduuca tartanka, oo ay na siiyeen qabanqaabiyeyaasha, ayaa keenay fikradda ah in aan ka fognahay kuwa ugu horreeya ee xallinaya dhibaatadan iyo, laga yaabee, waxaa jira nooc ka mid ah software khaas ah. Ka dib markii aan helnay meel kayd ah github halkaas oo hababka IsMuonSimple, IsMuon, IsMuonLoose laga hirgaliyay, waxaan ku wareejinay goobtayada iyada oo waxyar laga beddelayo. Hababka laftoodu aad bay u fududaayeen: tusaale ahaan, haddii tamartu ay ka yar tahay xad gaar ah, markaa ma aha muon, haddii kale waa muon. Tilmaamaha fudud ee noocan oo kale ah ayaa iska cad ma bixin karaan korodhka kiiska isticmaalka kor u qaadista gradient, sidaas darteed waxaan ku darnay "fog" kale oo muhiim ah marinka. Tilmaamahan ayaa sidoo kale xoogaa la hagaajiyay. Waxaa laga yaabaa, adoo si qoto dheer u falanqeynaya hababka jira, waxaa suurtagal ah in la helo habab xooggan oo lagu daro calaamadaha.

Dhammaadkii tartanka, waxaanu wax yar ka dhignay xalinta "dhakhso ah" ee dhibaatada labaad, ugu dambeyntii, waxay kaga duwan tahay gundhigga qodobbada soo socda:

  1. Safafka miisaanka taban ayaa bartilmaameedka loo rogay
  2. Buuxiyay qiyamka maqan ee MatchedHit_{X,Y,Z}[N]
  3. Moolka la dhimay oo laga dhigay 7
  4. Heerka waxbarashada oo la dhimay 0.1 (wuxuu ahaa 0.19)

Natiijo ahaan, waxaan isku daynay astaamo badan (oo aan si guul leh u gaarin), cabbiro la doortay iyo catboost tababaran, lightgbm iyo xgboost, waxaan isku daynay saadaasha kala duwan oo la isku daray ka hor inta aan la furin kuwa gaarka ah waxaan si kalsooni leh ugu guuleysanay hawshii labaad, markii ugu horreysayna waxaan ka mid ahayn madaxda.

Furitaanka gaarka ah ka dib waxaan ku jirnay kaalinta 10aad ee hawsha 1aad iyo 3aad ee labaad. Madaxdii oo dhami waa isku dhex milmeen, xawaaruhuna wuxuu ahaa mid ka sarreeya kii sabuuradda. Waxay u muuqataa in xogta si liidata loo habeeyey (ama tusaale ahaan ma jirin saf leh miisaan taban oo qarsoodi ah) tanina waxay ahayd waxoogaa niyad jab ah.

SNA Hackathon 2019 - Qoraallada. Marxaladda koowaad

Hawshu waxay ahayd in lagu qiimeeyo qoraallada isticmaalaha shabakadda bulshada ee Odnoklassniki iyadoo lagu saleynayo qoraalka ay ka kooban yihiin; marka lagu daro qoraalka, waxaa jiray dhowr astaamood oo dheeri ah oo boostada ah (luqadda, mulkiilaha, taariikhda iyo waqtiga abuuritaanka, taariikhda iyo waqtiga la daawado). ).

Sida hababka qadiimiga ah ee ku shaqaynta qoraalka, waxaan muujin doonaa laba ikhtiyaar:

  1. Ku khariidaynta kelmad kasta meel bannaan oo n-cabbir ah si ay ereyada la midka ahi u yeeshaan calaamado isku mid ah (wax badan ka sii akhri maqaalkayaga), ka dibna ama helida celceliska kelmadda qoraalka ama la isticmaalo habab xisaabta ku darsaya halka ay ereyada ka xigaan (CNN, LSTM/GRU).
  2. Isticmaalka moodooyinka isla markiiba la shaqayn kara jumlado dhan. Tusaale ahaan, Bert. Aragti ahaan, habkani waa inuu si fiican u shaqeeyaa.

Maadaama ay tani ahayd waayo-aragnimadayda ugu horreysay ee qoraallada, way qaldanaan lahayd inaan qof baro, sidaas darteed waxaan wax bari doonaa naftayda. Kuwani waa talooyinka aan naftayda siin lahaa bilowga tartanka:

  1. Kahor intaadan u ordin inaad wax barato, fiiri xogta! Marka laga soo tago qoraalka laftiisa, xogtu waxay lahayd dhowr tiir oo ay suurtagal ahayd in laga soo saaro wax ka badan intii aan sameeyay. Waxa ugu fudud ayaa ah in la sameeyo codaynta bartilmaameedka ee tiirarka qaarkood.
  2. Ha ka baran dhammaan xogta! Waxaa jiray xog badan (qiyaastii 17 milyan oo saf) oo gabi ahaanba ma ahayn lagama maarmaan in la isticmaalo dhamaantood si loo tijaabiyo mala-awaalka. Tababarka iyo diyaarintu aad ayay u gaabis ahaayeen, waxaana iska cad in aan heli lahaa wakhti aan ku tijaabiyo mala-awaalyo xiiso badan.
  3. <Talo muran dhalisay> Looma baahna in la raadiyo nooc dilaa ah. Waxaan ku qaatay waqti dheer si aan u ogaado Elmo iyo Bert, anigoo rajeynaya inay isla markiiba i geyn doonaan meel sare, natiijaduna waxay tahay inaan isticmaalo FastText wax-soo-saarka horay loo tababaray ee luqadda Ruushka. Xawaar fiican kuma aanan gaari karin Elmo, welina waqti uma helin inaan ku ogaado Bert.
  4. <Talo muran dhalisay> Looma baahna in la raadiyo hal sifo oo dilaa ah. Markaan eegay xogta, waxaan ogaaday in ku dhawaad ​​1 boqolkiiba qoraallada aysan run ahaantii ku jirin qoraal! Laakin waxaa jiray xiriiro la xiriira kheyraadka qaarkood, waxaanan qoray falanqeyn fudud oo furay goobta oo soo saaray cinwaanka iyo sharraxaadda. Waxay u muuqatay fikrad wanaagsan, laakiin ka dib waa la ii qaaday oo waxaan go'aansaday inaan kala saaro dhammaan xiriiriyeyaasha qoraallada oo dhan oo mar kale lumay waqti badan. Waxaas oo dhami ma aysan bixin horumar la taaban karo oo natiijada kama dambaysta ah (inkasta oo aan qiyaasay stemming, tusaale ahaan).
  5. Tilmaamaha Classic ayaa shaqeeya. Annagu Google-ka, tusaale ahaan, "qoraalka sifada kaggle", akhri oo ku dar wax kasta. TF-IDF waxay bixisay horumar, si la mid ah astaamaha tirakoobka sida dhererka qoraalka, erayada, iyo qaddarka xarakaynta.
  6. Haddii ay jiraan tiirarka DateTime, waxaa habboon in loo kala saaro dhowr astaamood oo kala duwan (saacadaha, maalmaha toddobaadka, iwm.). Astaamaha ay tahay in la iftiimiyo waa in lagu falanqeeyaa iyada oo la isticmaalayo garaafyo/mitirooyin. Halkan, niyad, waxaan si sax ah u sameeyay wax kasta oo aan iftiimiyay sifooyinka lagama maarmaanka ah, laakiin falanqaynta caadiga ah ma dhaawacayso (tusaale ahaan, sida aan samaynay finalka).

Hadron Collider weyn iyo Odnoklassniki

Natiijadii tartanka, waxaan u tababaray hal nooc oo keras ah oo leh kelmadda convolution, iyo mid kale oo ku saleysan LSTM iyo GRU. Labaduba waxay isticmaaleen xirmooyinka FastText ee horay loo tababaray ee luqadda Ruushka (Waxaan isku dayay tiro ka mid ah kuwa kale ee la isku dhejiyay, laakiin kuwani waxay ahaayeen kuwa si fiican u shaqeeyay). Ka dib celceliska saadaasha, waxaan galay kaalinta 7-aad ee ugu dambeysay 76 kaqeybgale.

Ka dib markii marxaladda koowaad waxaa la daabacay maqaal uu qoray Nikolai Anokhin, oo galay kaalinta labaad (waxa uu ka qayb galay tartanka), xalkiisa ilaa marxaladda qaar ayaa igu soo noqnoqonayay, laakiin wuu sii dheeraaday sababtoo ah habka dareenka-furaha-furaha.

Marxaladda labaad OK & IDO

Marxaladihii labaad ee tartamadu waxa ay dhaceen ku dhawaad ​​si xidhiidh ah, sidaa awgeed waxa aan go’aansaday in aan si wada jir ah u eego.

Marka hore, aniga iyo kooxda cusub ee la helay waxay ku dhammaatay xafiiska cajiibka ah ee shirkadda Mail.ru, halkaas oo hawsheenu ahayd in la isku daro moodooyinka saddexda waddo ee marxaladda koowaad - qoraal, sawirro iyo wadashaqeyn. Wax yar ka badan 2 maalmood ayaa loo qoondeeyay tan, taas oo noqotay mid aad u yar. Dhab ahaantii, waxaan awoodnay oo kaliya inaan ku celino natiijooyinkeena marxaladii ugu horeysay iyadoon wax faa'iido ah ka helin isku darka. Dhammaadkii, waxaanu galnay kaalinta 5-aad, laakiin ma awoodno inaan isticmaalno qaabka qoraalka. Ka dib markaan eegno xalalka ka qaybgalayaasha kale, waxay u muuqataa inay mudan tahay in la isku dayo in la ururiyo qoraallada oo lagu daro qaabka iskaashiga. Saamaynta dhinaca marxaladan waxay ahayd aragtiyo cusub, la kulanka iyo la xidhiidhka ka qaybgalayaasha iyo qabanqaabiyeyaasha qabow, iyo sidoo kale hurdo la'aan daran, taas oo laga yaabo inay saamaysay natiijada marxaladda ugu dambeysa ee IDO.

Hawsha IDAO 2019 marxaladda kama dambaysta ah waxay ahayd in la saadaaliyo waqtiga sugitaanka ee amarka darawallada Yandex ee gegida dayuuradaha. Marxaladda 2, 3 hawlood = 3 garoon diyaaradeed ayaa la aqoonsaday. Madaar kasta, xogta daqiqo-daqiiqo ee tirada dalabaadka tagaasida ee lix bilood ayaa la bixiyaa. Iyo sida xogta tijaabada ah, xogta bisha soo socota iyo daqiiqad-daqiiqo-daqiiqo ee amarrada 2 toddobaad ee la soo dhaafay ayaa la bixiyay. Waxaa jiray waqti yar (1,5 maalmood), hawshu waxay ahayd mid gaar ah, kaliya hal qof oo ka mid ah kooxda ayaa yimid tartanka - natiijaduna waxay ahayd meel murugo leh ilaa dhamaadka. Fikradaha xiisaha leh waxaa ka mid ah isku dayga lagu isticmaalo xogta dibadda: cimilada, saxmada taraafiga iyo tirakoobka dalabka tagsiga ee Yandex. Inkasta oo qabanqaabiyayaashu aysan sheegin waxa ay yihiin garoomada diyaaradaha, ka qaybgalayaasha badan ayaa u maleynayay inay yihiin Sheremetyevo, Domodedovo iyo Vnukovo. Inkasta oo malo-awaalkan la diiday tartanka ka dib, sifooyinka, tusaale ahaan, xogta cimilada ee Moscow ayaa hagaajisay natiijooyinka labadaba ansaxinta iyo dhinaca hogaanka.

gunaanad

  1. Tartamada ML waa qabow oo xiiso leh! Halkan waxaad ka heli doontaa isticmaalka xirfadaha falanqaynta xogta, iyo moodooyinka khiyaanada leh iyo farsamooyinka, iyo si fudud caqli-galnimada waa la soo dhaweynayaa.
  2. ML waa horeba aqoon aad u wayn oo u muuqata inay si xad dhaaf ah u korayso. Waxaan naftayda dajiyay yool aan ku baranayo meelo kala duwan (calaamadaha, sawirada, miisaska, qoraalka) waxaanan mar hore ogaaday inta ay le'eg tahay in la barto. Tusaale ahaan, tartammadan ka dib waxaan go'aansaday inaan barto: algorithms-ka ururinta, farsamooyinka horumarsan ee la shaqaynta maktabadaha kor u qaadaya gradient (gaar ahaan, la shaqaynta CatBoost ee GPU), shabakadaha kaabsulka, habka dareenka-qiimaha weydiinta.
  3. Ma aha kaggle oo keliya! Waxaa jira tartamo kale oo badan oo ay fududahay in la helo ugu yaraan funaanad, waxaana jira fursado badan oo abaalmarino kale ah.
  4. La xidhiidh! Waxaa horayba u jiray bulsho weyn oo ku saabsan barashada mashiinka iyo falanqaynta xogta, waxaa jira kooxo mawduucyo ah oo ku jira telegram, caajis, iyo dad dhab ah oo ka socda Mail.ru, Yandex iyo shirkadaha kale waxay ka jawaabaan su'aalaha waxayna caawiyaan bilawga iyo kuwa sii wadaya jidkooda goobtan. ee aqoonta.
  5. Waxaan kula talinayaa qof kasta oo ku dhiirigeliyay qodobka hore inuu soo booqdo datafest - shir weyn oo bilaash ah oo ka dhacaya Moscow, kaas oo dhici doona May 10-11.

Source: www.habr.com

Add a comment