Giunsa nako pag-organisar ang pagbansay sa pagkat-on sa makina sa NSU

Ang akong ngalan mao si Sasha ug ganahan ko sa pagkat-on sa makina ingon man sa pagtudlo sa mga tawo. Karon ako nagdumala sa mga programa sa edukasyon sa Computer Science Center ug nagdumala sa bachelor's degree sa data analysis sa St. Petersburg State University. Sa wala pa niana, nagtrabaho siya isip usa ka analista sa Yandex, ug bisan sa sayo pa isip usa ka siyentista: nakigbahin siya sa pagmodelo sa matematika sa Institute of Computer Science sa SB RAS.

Sa kini nga post gusto nakong isulti kanimo kung unsa ang gigikanan sa ideya sa paglansad sa pagbansay sa pagkat-on sa makina alang sa mga estudyante, mga gradwado sa Novosibirsk State University ug uban pa.

Giunsa nako pag-organisar ang pagbansay sa pagkat-on sa makina sa NSU

Dugay na kong gusto nga mag-organisar og usa ka espesyal nga kurso sa pag-andam alang sa mga kompetisyon sa pagtuki sa datos sa Kaggle ug uban pang mga plataporma. Kini daw usa ka maayo nga ideya:

  • Ang mga estudyante ug bisan kinsa nga interesado mogamit sa teoretikal nga kahibalo sa praktis ug makaangkon og kasinatian sa pagsulbad sa mga problema sa publiko nga kompetisyon.
  • Ang mga estudyante nga nagbutang sa ibabaw sa maong mga kompetisyon adunay maayong epekto sa pagkamadanihon sa NSU alang sa mga aplikante, estudyante ug gradwado. Ang parehas nga butang mahitabo sa pagbansay sa programming sa sports.
  • Kini nga espesyal nga kurso hingpit nga nagsangkap ug nagpalapad sa sukaranan nga kahibalo: ang mga partisipante independente nga nag-implementar sa mga modelo sa pagkat-on sa makina ug kanunay nga nagporma mga team nga nakigkompetensya sa global nga lebel.
  • Ang ubang mga unibersidad nakahimo na sa ingon nga pagbansay, mao nga naglaum ako nga molampos ang espesyal nga kurso sa NSU.

Lansad

Ang Akademgorodok sa Novosibirsk adunay tabunok kaayo nga yuta alang sa ingon nga mga paningkamot: mga estudyante, mga gradwado ug mga magtutudlo sa Computer Science Center ug lig-on nga mga teknikal nga kahanas, pananglitan, FIT, MMF, FF, lig-on nga suporta sa administrasyon sa NSU, usa ka aktibo nga komunidad sa ODS, eksperyensiyadong mga inhenyero. ug mga analista gikan sa lainlaing mga kompanya sa IT. Sa parehas nga oras, nahibal-an namon ang bahin sa programa sa paghatag gikan sa Mga Pamuhunan sa Botan β€” ang pondo nagsuporta sa mga team nga nagpakitag maayong resulta sa ML sports competitions.

Nakit-an namo ang usa ka mamiminaw sa NSU alang sa sinemana nga mga miting, naghimo og chat sa Telegram, ug gilusad niadtong Oktubre 1 kauban ang mga estudyante ug mga gradwado sa CS center. 19 ka tawo ang miabut sa unang leksyon. Unom kanila nahimong regular nga partisipante sa pagbansay-bansay. Sa kinatibuk-an, 31 ka tawo ang mitambong sa miting labing menos kausa sa tuig sa akademiko.

Unang mga resulta

Ang mga lalaki ug ako nagkita, nagbinayloay og mga kasinatian, naghisgot sa mga kompetisyon ug usa ka dili maayo nga plano alang sa umaabot. Dali ra kami nakaamgo nga ang pagpakig-away alang sa mga lugar sa mga kompetisyon sa pag-analisar sa datos mao ang regular, makahahadlok nga trabaho, susama sa wala'y bayad nga full-time nga trabaho, apan makaiikag kaayo ug kulbahinam πŸ™‚ Usa sa mga partisipante, si Kaggle-master Maxim, nagtambag kanamo nga una nga mag-abante sa mga kompetisyon nga tagsa-tagsa. , ug pipila lang ka semana ang milabay maghiusa ngadto sa mga team, nga gikonsiderar ang publiko nga iskor. Mao na among gibuhat! Atol sa pagbansay-bansay sa nawong-sa-nawong, among gihisgutan ang mga modelo, siyentipikong mga artikulo, ug ang kakuti sa mga librarya sa Python, ug dungan nga gisulbad ang mga problema.

Ang mga resulta sa fall semester mao ang tulo ka silver medals sa duha ka kompetisyon sa Kaggle: TGS Salt Identification ΠΈ Klasipikasyon sa Astronomiya sa PLAsTiCC. Ug usa ka ikatulo nga dapit sa kompetisyon sa CFT alang sa pagtul-id sa mga typo sa unang salapi nga nakadaog (sa kuwarta, ingon sa giingon sa mga eksperyensiyado nga mga kegler).

Ang usa pa ka hinungdanon nga dili direkta nga sangputanan sa espesyal nga kurso mao ang paglansad ug pag-configure sa cluster sa NSU VKI. Ang gahum sa pag-compute niini nakapauswag pag-ayo sa atong kompetisyon nga kinabuhi: 40 ka CPU, 755Gb RAM, 8 NVIDIA Tesla V100 GPU.

Giunsa nako pag-organisar ang pagbansay sa pagkat-on sa makina sa NSU

Sa wala pa kana, nakalahutay kami kutob sa among mahimo: nagkalkula kami sa mga personal nga laptop ug desktop, sa Google Colab ug sa Kaggle-kernels. Ang usa ka team adunay bisan usa ka sinulat sa kaugalingon nga script nga awtomatikong nagtipig sa modelo ug gisugdan pag-usab ang kalkulasyon nga nahunong tungod sa limitasyon sa oras.

Sa semester sa tingpamulak, nagpadayon kami sa pagpundok, pagbinayloay sa malampuson nga mga nahibal-an ug paghisgot bahin sa among mga solusyon sa kompetisyon. Ang bag-ong interesadong mga partisipante nagsugod sa pag-abot kanamo. Atol sa semester sa tingpamulak, nakahimo kami sa pagkuha og usa ka bulawan, tulo ka plata ug siyam ka bronse sa walo ka kompetisyon sa Kaggle: PetFinder, Santander, Resolusyon sa gender, Pag-ila sa Balyena, Quora, Mga Landmark sa Google ug uban pa, bronze in Recco nga hagit, ikatulo nga dapit sa Changellenge>>Cup ug unang dapit (pag-usab sa kwarta) sa kompetisyon sa pagkat-on sa makina sa programming championship gikan sa Yandex.

Unsa ang gisulti sa mga partisipante sa pagbansay

Mikhail Karchevsky
"Nalipay kaayo ko nga ang ingon nga mga kalihokan gihimo dinhi sa Siberia, tungod kay nagtuo ako nga ang pag-apil sa mga kompetisyon mao ang labing kadali nga paagi aron ma-master ang ML. Alang sa ingon nga mga kompetisyon, ang hardware mahal kaayo aron mapalit sa imong kaugalingon, apan dinhi mahimo nimong sulayan ang mga ideya nga libre.

Kirill Brodt
"Sa wala pa ang pag-abut sa pagbansay sa ML, wala ako labi nga miapil sa mga kompetisyon gawas sa pagbansay ug mga kompetisyon sa Hindu: Wala nako makita ang punto niini, tungod kay ako adunay trabaho sa natad sa ML, ug pamilyar ako niini. Ang unang semester nga akong gitambongan isip estudyante. Ug sugod sa ikaduhang semestre, sa diha nga ang mga kapanguhaan sa pag-compute mahimong magamit, naghunahuna ko, nganong dili moapil. Ug kini nakadani kanako. Ang buluhaton, datos ug sukatan giimbento ug giandam alang kanimo, padayon ug gamita ang bug-os nga gahum sa MO, susiha ang state-of-the-art nga mga modelo ug mga teknik. Kung dili tungod sa pagbansay ug, ingon ka hinungdanon, ang mga kapanguhaan sa pag-compute, dili unta ako magsugod sa pag-apil sa dili madugay. ”

Andrey Shevelev
"Ang in-person nga pagbansay sa ML nakatabang kanako sa pagpangita sa mga tawo nga sama sa hunahuna, nga akong napauswag ang akong kahibalo sa natad sa pagkat-on sa makina ug pagtuki sa datos. Kini usab usa ka maayo kaayo nga kapilian alang sa mga wala’y daghang libre nga oras nga independente nga mag-analisar ug isubsob ang ilang kaugalingon sa hilisgutan sa mga kompetisyon, apan gusto gihapon nga naa sa hilisgutan.

apil mi

Ang mga kompetisyon sa Kaggle ug uban pang mga plataporma nagbansay sa praktikal nga mga kahanas ug dali nga nakabig sa makapaikag nga trabaho sa natad sa siyensya sa datos. Ang mga tawo nga nakigbahin sa usa ka lisud nga kompetisyon nga magkauban kanunay nga mahimong mga kauban ug nagpadayon sa malampuson nga pagsulbad sa mga problema nga may kalabutan sa trabaho. Nahitabo usab kini kanamo: Si Mikhail Karchevsky, kauban ang usa ka higala gikan sa grupo, nagtrabaho alang sa parehas nga kompanya sa usa ka sistema sa rekomendasyon.

Sa paglabay sa panahon, nagplano kami nga palapdan kini nga kalihokan gamit ang siyentipikong mga publikasyon ug pag-apil sa mga komperensya sa pagkat-on sa makina. Apil kanamo isip mga partisipante o mga eksperto sa Novosibirsk - pagsulat sa akoa o Si Kirill. Pag-organisar og susama nga pagbansay sa imong mga siyudad ug unibersidad.

Ania ang gamay nga cheat sheet aron matabangan ka sa paghimo sa imong unang mga lakang:

  1. Hunahunaa ang usa ka kombenyente nga lugar ug oras alang sa regular nga mga klase. Labing maayo - 1-2 beses sa usa ka semana.
  2. Pagsulat ngadto sa posibleng interesadong mga partisipante mahitungod sa unang miting. Una sa tanan, kini mga estudyante sa mga teknikal nga unibersidad, mga partisipante sa ODS.
  3. Pagsugod sa usa ka chat aron hisgutan ang karon nga mga kalihokan: Telegram, VK, WhatsApp o bisan unsang uban pang messenger nga sayon ​​​​alang sa kadaghanan.
  4. Hupti ang usa ka plano sa leksyon nga magamit sa publiko, usa ka lista sa mga kompetisyon ug mga partisipante, ug bantayan ang mga resulta.
  5. Pangita ug libreng computing power o grants para niini sa duol nga mga unibersidad, research institute o kompanya.
  6. PABILIN!

Tinubdan: www.habr.com

Idugang sa usa ka comment