Mar a chuir mi trèanadh ionnsachadh inneal air dòigh aig NSU

Is e m ’ainm Sasha agus is toil leam ionnsachadh innealan a bharrachd air a bhith a’ teagasg dhaoine. A-nis bidh mi a’ cumail sùil air prògraman foghlaim aig an Ionad Saidheans Coimpiutaireachd agus a’ stiùireadh a’ phrògram baidsealair ann an mion-sgrùdadh dàta aig Oilthigh Stàite St Petersburg. Roimhe sin, bha e ag obair mar mhion-sgrùdair aig Yandex, agus eadhon na bu tràithe mar neach-saidheans: bha e an sàs ann am modaileadh matamataigeach aig Institiud Saidheans Coimpiutaireachd an SB RAS.

Anns an dreuchd seo tha mi airson innse dhut dè a thàinig bhon bheachd a bhith a’ cur air bhog trèanadh ionnsachadh inneal do dh’ oileanaich, ceumnaichean Oilthigh Stàite Novosibirsk agus a h-uile duine eile.

Mar a chuir mi trèanadh ionnsachadh inneal air dòigh aig NSU

Tha mi air a bhith ag iarraidh o chionn fhada cùrsa sònraichte a chuir air dòigh mu bhith ag ullachadh airson farpaisean mion-sgrùdadh dàta air Kaggle agus àrd-ùrlaran eile. Bha e coltach gur e deagh bheachd a bha seo:

  • Cleachdaidh oileanaich agus neach sam bith le ùidh eòlas teòiridheach ann an cleachdadh agus gheibh iad eòlas air fuasgladh cheistean ann am farpaisean poblach.
  • Bidh buaidh mhath aig oileanaich a tha aig a’ mhullach ann am farpaisean mar seo air cho tarraingeach sa tha NSU do thagraichean, oileanaich agus ceumnaichean. Tha an aon rud a’ tachairt le trèanadh prògramadh spòrs.
  • Tha an cùrsa sònraichte seo gu foirfe a’ cur ri agus a’ leudachadh eòlas bunaiteach: bidh com-pàirtichean gu neo-eisimeileach a’ cur an gnìomh mhodalan ionnsachaidh inneal agus gu tric a’ cruthachadh sgiobaidhean a bhios a’ farpais aig ìre chruinneil.
  • Bha oilthighean eile air a leithid de thrèanadh a dhèanamh mar-thà, agus mar sin bha mi an dòchas gum biodh an cùrsa sònraichte aig NSU soirbheachail.

Запуск

Tha talamh fìor thorrach aig Akademgorodok Novosibirsk airson a leithid de dh’ oidhirpean: oileanaich, ceumnaichean agus tidsearan an Ionad Coimpiutaireachd agus dàmhan teicnigeach làidir, mar eisimpleir, FIT, MMF, FF, taic làidir bho rianachd NSU, coimhearsnachd gnìomhach ODS, innleadairean eòlach. agus sgrùdairean bho dhiofar chompanaidhean IT. Timcheall air an aon àm, dh’ ionnsaich sinn mun phrògram tabhartais bho Botan Investments - tha a’ mhaoin a’ toirt taic do sgiobaidhean a tha a’ nochdadh deagh thoraidhean ann am farpaisean spòrs ML.

Lorg sinn luchd-èisteachd aig NSU airson coinneamhan seachdaineil, chruthaich sinn còmhradh air Telegram, agus chaidh a chuir air bhog air 1 Dàmhair còmhla ri oileanaich agus ceumnaichean an ionaid CS. Thàinig 19 neach chun chiad leasan. Thàinig sianar dhiubh gu bhith nan com-pàirtichean cunbhalach ann an trèanadh. Uile gu lèir, thàinig 31 neach chun na coinneimh co-dhiù aon turas sa bhliadhna acadaimigeach.

Ciad toraidhean

Choinnich na balaich agus mise, ag iomlaid eòlasan, a’ deasbad farpaisean agus plana garbh airson an ama ri teachd. Gu math luath thuig sinn gur e obair cunbhalach, dòrainneach a th’ ann a bhith a’ sabaid airson àiteachan ann am farpaisean mion-sgrùdadh dàta, coltach ri obair làn-ùine gun phàigheadh, ach gu math inntinneach is brosnachail 🙂 Chomhairlich aon de na com-pàirtichean, Kaggle-master Maxim, dhuinn a dhol air adhart ann am farpaisean leotha fhèin. , agus dìreach beagan sheachdainean às deidh sin thig còmhla ann an sgiobaidhean, a’ toirt aire don sgòr poblach. Sin a rinn sinn! Rè trèanadh aghaidh-ri-aghaidh, bheachdaich sinn air modalan, artaigilean saidheansail, agus iom-fhillteachd leabharlannan Python, agus dh’ fhuasgail sinn duilgheadasan còmhla.

B’ e toraidhean an t-semeastar tuiteam trì buinn airgid ann an dà fharpais air Kaggle: Aithneachadh salann TGS и Seòrsachadh Reul-eòlais PLAsTiCC. Agus an treas àite ann am farpais CFT airson a bhith a’ ceartachadh typos leis a’ chiad airgead a chaidh a bhuannachadh (san airgead, mar a chanas keglers eòlach).

B 'e toradh neo-dhìreach fìor chudromach eile den chùrsa sònraichte cur air bhog agus rèiteachadh buidheann NSU VKI. Tha a chumhachd coimpiutaireachd air leasachadh mòr a thoirt air ar beatha farpaiseach: 40 CPUs, 755Gb RAM, 8 NVIDIA Tesla V100 GPUs.

Mar a chuir mi trèanadh ionnsachadh inneal air dòigh aig NSU

Roimhe sin, mhair sinn mar a b’ fheàrr a b’ urrainn dhuinn: rinn sinn cunntas air coimpiutairean-uchd agus deasg pearsanta, ann an Google Colab agus ann an Kaggle-kernels. Bha eadhon sgriobt fèin-sgrìobhte aig aon sgioba a shàbhail am modail gu fèin-ghluasadach agus a chuir air ais an àireamhachadh a stad air sgàth crìoch ùine.

Ann an semeastar an earraich, chùm sinn oirnn a’ cruinneachadh, ag iomlaid thoraidhean soirbheachail agus a’ bruidhinn mu na fuasglaidhean againn don cho-fharpais. Thòisich com-pàirtichean ùra le ùidh a’ tighinn thugainn. Rè semeastar an earraich, chaidh againn air aon òr, trì airgead agus naoi umha a ghabhail ann an ochd farpaisean air Kaggle: Peata-lorg, Santander, Fuasgladh gnè, Aithneachadh Muc-mhara, Quora, Comharran-tìre Ghoogle agus cuid eile, umha a stigh Dùbhlan Recco, an treas àite ann an Changellenge >> Cupa agus a’ chiad àite (a-rithist san airgead) ann am farpais ionnsachadh inneal aig farpais prògramadh bho Yandex.

Na tha com-pàirtichean trèanaidh ag ràdh

Mikhail Karchevskiy
“Tha mi glè thoilichte gu bheil an leithid de ghnìomhachd air a dhèanamh an seo ann an Siberia, oir tha mi a’ creidsinn gur e com-pàirteachadh ann am farpaisean an dòigh as luaithe air ML a mhaighstir. Airson a leithid de cho-fharpaisean, tha am bathar-cruaidh gu math daor a cheannach dhut fhèin, ach an seo faodaidh tu feuchainn air beachdan an-asgaidh. ”

Kirill Brodt
“Mus tàinig trèanadh ML, cha do ghabh mi pàirt gu sònraichte ann am farpaisean ach a-mhàin trèanadh agus farpaisean Hindu: chan fhaca mi a’ phuing ann an seo, leis gu robh obair agam ann an raon ML, agus bha mi eòlach air. A’ chiad semeastar a fhritheil mi mar oileanach. Agus a’ tòiseachadh bhon dàrna semeastar, cho luath ‘s a bha goireasan coimpiutaireachd rim faighinn, shaoil ​​​​mi, carson nach gabh thu pàirt. Agus chuir e iongnadh orm. Chaidh an gnìomh, an dàta agus na meatrach a chruthachadh agus ullachadh dhut, rachaibh air adhart agus cleachd làn chumhachd MO, thoir sùil air na modalan agus na dòighean as ùire. Mura b’ ann airson an trèanaidh agus, a cheart cho cudromach, na goireasan coimpiutaireachd, cha bhithinn air tòiseachadh a’ gabhail pàirt a dh’ aithghearr.”

Andrey Shevelev
“Chuidich trèanadh ML pearsanta mi gus daoine den aon seòrsa inntinn a lorg, leis an robh e comasach dhomh m’ eòlas ann an raon ionnsachadh innealan agus mion-sgrùdadh dàta a dhoimhneachadh. Tha seo cuideachd na dheagh roghainn dhaibhsan aig nach eil mòran ùine shaor airson mion-sgrùdadh neo-eisimeileach a dhèanamh agus iad fhèin a bhogadh ann an cuspair farpaisean, ach a tha fhathast airson a bhith sa chuspair.”

thig còmhla rinn

Bidh farpaisean air Kaggle agus àrd-ùrlaran eile a’ neartachadh sgilean practaigeach agus ag atharrachadh gu sgiobalta gu obair inntinneach ann an raon saidheans dàta. Bidh daoine a tha air pàirt a ghabhail ann am farpais dhoirbh còmhla gu tric nan co-obraichean agus a 'leantainn air adhart gu soirbheachail a' fuasgladh dhuilgheadasan co-cheangailte ri obair. Thachair seo dhuinn cuideachd: Mikhail Karchevsky, còmhla ri caraid bhon sgioba, chaidh e gu obair airson an aon chompanaidh air siostam molaidh.

Thar ùine, tha sinn an dùil an gnìomhachd seo a leudachadh le foillseachaidhean saidheansail agus com-pàirteachadh ann an co-labhairtean ionnsachadh innealan. Thig còmhla rinn mar chom-pàirtichean no eòlaichean ann an Novosibirsk - sgrìobh mi no Cirill. Cuir air dòigh trèanadh coltach ris anns na bailtean-mòra agus na h-oilthighean agad.

Seo duilleag meallta beag gus do chuideachadh le bhith a’ gabhail a’ chiad cheuman agad:

  1. Beachdaich air àite agus àm freagarrach airson clasaichean cunbhalach. Optimally - 1-2 tursan san t-seachdain.
  2. Sgrìobh gu com-pàirtichean a dh’ fhaodadh ùidh a bhith aca mun chiad choinneamh. An toiseach, is iad sin oileanaich oilthighean teignigeach, com-pàirtichean ODS.
  3. Tòisich còmhradh gus beachdachadh air cùisean an latha: Telegram, VK, WhatsApp no ​​teachdaire sam bith eile a tha iomchaidh don mhòr-chuid.
  4. Cùm plana leasain a tha ruigsinneach don phoball, liosta de cho-fharpaisean agus chom-pàirtichean, agus cùm sùil air na toraidhean.
  5. Lorg cumhachd coimpiutaireachd an-asgaidh no tabhartasan air a shon ann an oilthighean, institiudan rannsachaidh no companaidhean faisg air làimh.
  6. BRATHADH!

Tobar: www.habr.com

Cuir beachd ann