Мен НМУда машина үйрөнүүнү кантип уюштурдум

Менин атым Саша жана мен машиналарды үйрөнүүнү жана адамдарды үйрөтүүнү жакшы көрөм. Азыр мен Компьютердик илимдер борборунда билим берүү программаларын жетектейм жана Санкт-Петербург мамлекеттик университетинде маалыматтарды талдоо боюнча бакалавр программасын жетектейм. Ага чейин ал Яндексте аналитик болуп иштеген, андан мурдараак окумуштуу: АКК SB Информатика институтунда математикалык моделдөө менен алектенген.

Бул постто мен студенттерге, Новосибирск мамлекеттик университетинин бүтүрүүчүлөрүнө жана башкаларга машиналык окутууну баштоо идеясы эмнеден келип чыкканын айткым келет.

Мен НМУда машина үйрөнүүнү кантип уюштурдум

Мен көптөн бери Kaggle жана башка платформаларда маалыматтарды талдоо боюнча сынактарга даярдануу боюнча атайын курс уюштургум келчү. Бул сонун идея болуп көрүндү:

  • Студенттер жана каалоочулар теориялык билимдерин практикада колдонушат жана коомдук сынактарда маселелерди чечүү боюнча тажрыйба алышат.
  • Мындай сынактарда алдыңкы орундарды ээлеген студенттер НМУнун абитуриенттер, студенттер жана бүтүрүүчүлөр үчүн жагымдуу болушуна жакшы таасирин тийгизет. Ошол эле нерсе спорттук программалоо тренинги менен болот.
  • Бул атайын курс фундаменталдык билимди эң ​​сонун толуктайт жана кеңейтет: катышуучулар машина үйрөнүү моделдерин өз алдынча ишке ашырышат жана көбүнчө дүйнөлүк деңгээлде атаандашкан командаларды түзүшөт.
  • Мындай окууну башка университеттер да өткөрүшкөн, ошондуктан НМУнун атайын курсунун ийгиликтүү өтүшүнө үмүттөндүм.

учуруу

Новосибирскинин Академиясында мындай аракеттер үчүн абдан ыңгайлуу шарт бар: Информатика борборунун студенттери, бүтүрүүчүлөрү жана окутуучулары жана күчтүү техникалык факультеттер, мисалы, FIT, MMF, FF, НМУнун администрациясынын күчтүү колдоосу, активдүү ODS коомчулугу, тажрыйбалуу инженерлер жана ар кандай IT компаниялардын аналитиктери. Ошол эле учурда биз гранттык программа менен тааныштык Botan Investments — ML спорттук мелдештерде жакшы натыйжаларды керсеткен командаларды фонд колдойт.

Биз НМУда жумалык жолугушууларга аудитория таап, Telegramда чат түзүп, 1-октябрдан баштап CS борборунун студенттери жана бүтүрүүчүлөрү менен биргеликте ишке киргиздик. Биринчи сабакка 19 адам келди. Алардын алтоо тренингдин үзгүлтүксүз катышуучусу болуп калышты. Жалпысынан окуу жылында бир жолудан кем эмес чогулушка 31 адам келген.

Биринчи жыйынтыктар

Жигиттер экөөбүз жолугуп, тажрыйба алмашып, сынактарды жана келечекке болжолдуу планды талкууладык. Маалыматтарды талдоо боюнча сынактарда орундар үчүн күрөшүү үзгүлтүксүз, түйшүктүү жумуш экенин, акы төлөнбөгөн толук убакыттагы жумушка окшош экенин, бирок абдан кызыктуу жана кызыктуу экенин тез түшүндүк 🙂 Катышуучулардын бири, Каггл-мастер Максим бизге сынактарда алгач жеке алдыга чыгууну кеңеш кылды. , жана бир нече жумадан кийин гана коомдук упайларды эске алуу менен командаларга биригишет. Биз ушундай кылдык! Бетме-бет тренингдин жүрүшүндө моделдерди, илимий макалаларды, Python китепканаларынын татаал жактарын талкуулап, көйгөйлөрдү чогуу чечтик.

Күзгү семестрдин жыйынтыгы Kaggle боюнча эки мелдеште үч күмүш медаль болду: TGS Salt идентификациясы и PLAsTiCC астрономиялык классификациясы. Жана биринчи акча менен каталарды оңдоо боюнча CFT конкурсунда үчүнчү орунду (акча менен, тажрыйбалуу кеглер айткандай) жеңип алды.

Атайын курстун дагы бир өтө маанилүү кыйыр натыйжасы НМУнун ВКИ кластерин ишке киргизүү жана конфигурациялоо болду. Анын эсептөө күчү биздин атаандаштык жашообузду бир топ жакшыртты: 40 CPU, 755 Гб оперативдүү эс тутум, 8 NVIDIA Tesla V100 GPU.

Мен НМУда машина үйрөнүүнү кантип уюштурдум

Ага чейин биз колубуздан келишинче аман калганбыз: жеке ноутбуктарда жана рабочий компьютерлерде, Google Colab жана Kaggle ядросунда эсептеп чыктык. Бир командада автоматтык түрдө моделди сактап, убакыттын чегинен улам токтоп калган эсептөөнү кайра баштаган өз алдынча жазылган сценарий бар болчу.

Жазгы семестрде биз чогулуп, ийгиликтүү жыйынтыктар менен алмашууну жана атаандаштыкты чечүү жолдору тууралуу сүйлөшүүнү уланттык. Бизге жаңы кызыккан катышуучулар келе баштады. Жазгы семестрде биз Kaggle боюнча сегиз мелдеште бир алтын, үч күмүш жана тогуз коло алууга жетиштик: PetFinder, Сантандер, Гендердик чечим, Киттин идентификациясы, Quora, Google Landmarks жана башкалар, коло Recco чакырыгы, Changellenge>>Кубогунда үчүнчү орун жана машина үйрөнүү сынагында биринчи орун (кайра акча менен) программалоо боюнча чемпионат Яндекстен.

Тренингдин катышуучулары эмне дейт

Михаил Карчевский
«Мындай иш-чаралар Сибирде өткөрүлүп жатканына абдан кубанычтамын, анткени мен мелдештерге катышуу MLди өздөштүрүүнүн эң тез жолу деп эсептейм. Мындай сынактар ​​үчүн аппаратураны өзүңүз сатып алуу өтө кымбатка турат, бирок бул жерде сиз идеяларды бекер сынап көрүүгө болот».

Кирилл Бродт
«ML тренинги пайда болгонго чейин мен машыгуудан жана индустук мелдештерден башка мелдештерге катышкан эмесмин: мен мунун маанисин көргөн жокмун, анткени мен ML тармагында иштегем жана аны жакшы билчүмүн. Биринчи семестрге студент кезимде катыштым. Ал эми экинчи семестрден баштап, компьютердик ресурстар пайда боло баштаганда, эмнеге катышпайм деп ойлодум. Жана бул мени байлап алды. Тапшырма, маалыматтар жана метрикалар сиз үчүн ойлоп табылган жана даярдалган, алдыга барыңыз жана MOнун толук күчүн колдонуңуз, заманбап моделдерди жана ыкмаларды текшериңиз. Эгерде тренинг жана эң негизгиси, эсептөө ресурстары болбогондо, мен жакында катышмак эмесмин».

Андрей Шевелев
«Инсандык ML тренинги мага окшош адамдарды табууга жардам берди, алар менен мен машинаны үйрөнүү жана маалыматтарды талдоо жаатындагы билимимди тереңдете алдым. Бул ошондой эле сынактардын темасын өз алдынча талдап, сүңгүүгө бош убактысы жок, бирок дагы эле темада болгусу келгендер үчүн эң сонун вариант».

бизге кошул

Kaggle жана башка платформалардагы сынактар ​​практикалык көндүмдөрдү өркүндөтүп, тез эле маалымат илими тармагында кызыктуу ишке айланышат. Татаал мелдешке чогуу катышкандар кебунче кесиптеш болуп, иштеги маселелерди ийгиликтуу чечууну уланта беришет. Бул бизде да болду: Михаил Карчевский командадагы досу менен бирге ошол эле ишканага рекомендация системасы боюнча иштеген.

Убакыттын өтүшү менен биз бул ишти илимий басылмалар жана машина үйрөнүү конференцияларына катышуу менен кеңейтүүнү пландап жатабыз. Новосибирсктеги катышуучулар же эксперттер катары бизге кошулуңуз - жазыңыз мага же Кирилл. Шаарларыңызда жана университеттериңизде ушундай тренингдерди уюштуруңуз.

Бул жерде сизге алгачкы кадамдарыңызды жасоого жардам бере турган кичинекей алдамчылык баракчасы:

  1. Кадимки сабактар ​​үчүн ыңгайлуу жерди жана убакытты карап көрүңүз. Оптималдуу - жумасына 1-2 жолу.
  2. Кызыккан катышуучуларга биринчи жолугушуу жөнүндө жазыңыз. Биринчиден, булар техникалык жогорку окуу жайларынын студенттери, ОБСтин катышуучулары.
  3. Учурдагы маселелерди талкуулоо үчүн чатты баштаңыз: Telegram, VK, WhatsApp же көпчүлүк үчүн ыңгайлуу болгон башка мессенжер.
  4. Жалпыга жеткиликтүү сабак планын, сынактардын жана катышуучулардын тизмесин түзүп, натыйжаларга мониторинг жүргүзүү.
  5. Жакын жердеги университеттерде, илимий институттарда же компанияларда акысыз эсептөө күчүн же гранттарды табыңыз.
  6. ПАЙДА!

Булак: www.habr.com

Комментарий кошуу