我如何在 NSU 組織機器學習培訓

我叫 Sasha,我喜歡機器學習以及教人。 現在,我負責監督電腦科學中心的教育項目,並指導聖彼得堡國立大學數據分析學士學位。 在此之前,他曾在Yandex擔任分析師,更早的時候擔任科學家:在俄羅斯科學院SB計算機科學研究所從事數學建模工作。

在這篇文章中,我想告訴你為新西伯利亞州立大學的學生、畢業生和其他人啟動機器學習培訓的想法是怎樣的。

我如何在 NSU 組織機器學習培訓

我很早就想組織一門專門的課程來準備Kaggle和其他平台上的數據分析比賽。 這似乎是個好主意:

  • 學生和任何有興趣的人都可以將理論知識應用於實踐,並獲得在公開競賽中解決問題的經驗。
  • 在此類競賽中名列前茅的學生對新西伯利亞國立大學對申請者、學生和畢業生的吸引力有很好的影響。 體育編程訓練也會發生同樣的情況。
  • 這門特殊課程完美地補充和擴展了基礎知識:參與者獨立實施機器學習模型,並經常組建在全球層面上競爭的團隊。
  • 其他大學已經進行過這樣的培訓,所以我希望新山大學的專題課程能成功。

Запуск

新西伯利亞科學院為此類努力提供了肥沃的土壤:電腦科學中心的學生、畢業生和教師以及強大的技術人員,例如FIT、MMF、FF、NSU 管理部門的大力支持、活躍的ODS 社群、經驗豐富的工程師以及來自不同 IT 公司的分析師。 大約在同一時間,我們從 牡丹投資 — 該基金支持在 ML 體育比賽中取得良好成績的團隊。

我們在 NSU 找到了每週例會的觀眾,在 Telegram 上創建了聊天室,並於 1 月 19 日與電腦科學中心的學生和畢業生一起啟動了該活動。 第一堂課有31人來聽。 其中六人成為定期參加訓練的人。 學年期間,共有 XNUMX 人至少參加過一次會議。

第一個結果

我和這些傢伙見面,交換經驗,討論比賽和對未來的粗略計劃。 很快我們就意識到,爭奪數據分析比賽的席位是一項常規的、艱苦的工作,類似於無薪全職工作,但非常有趣和令人興奮🙂 其中一位參與者,Kaggle 大師Maxim,建議我們首先在比賽中單獨晉級,僅僅幾週後,考慮到公開分數,就團結成團隊。 這就是我們所做的! 在面對面的培訓中,我們討論了模型、科學文章和Python庫的複雜性,並一起解決了問題。

秋季學期的結果是在 Kaggle 的兩項比賽中獲得三枚銀牌: TGS鹽鑑定 и PLAsTiCC 天文分類。 並在 CFT 糾正拼字錯誤比賽中獲得第三名,並贏得了第一筆獎金(正如經驗豐富的 keglers 所說,是獎金)。

本次專題課程的另一個非常重要的間接成果是NSU VKI集群的啟動和配置。 其運算能力顯著提高了我們的競爭力:40 個 CPU、755Gb RAM、8 個 NVIDIA Tesla V100 GPU。

我如何在 NSU 組織機器學習培訓

在此之前,我們盡了最大努力生存下來:我們在個人筆記型電腦和桌上型電腦、Google Colab 和 Kaggle 核心中進行計算。 一個團隊甚至有一個自寫的腳本,可以自動保存模型並重新啟動因時間限製而停止的計算。

春季學期,我們繼續聚集在一起,交流成功的成果,討論我們的競賽解決方案。 新的有興趣的參與者開始來到我們這裡。 春季學期,我們在 Kaggle 的 XNUMX 項比賽中獲得了 XNUMX 金、XNUMX 銀和 XNUMX 銅的成績: 寵物搜尋器, 桑坦德, 性別分辨率, 鯨魚識別, Quora的, Google地標 和其他,銅牌 雷科挑戰, Changellenge>>盃賽第三名,機器學習競賽第一名(再次獲得獎金) 程式設計錦標賽 來自 Yandex.

培訓參與者怎麼說

米哈伊爾·卡爾切夫斯基
「我很高興這樣的活動在西伯利亞開展,因為我相信參加比賽是掌握機器學習的最快方法。 對於這樣的比賽,自己購買硬體相當昂貴,但在這裡你可以免費嘗試想法。”

基里爾·布羅德
「在機器學習訓練出現之前,除了訓練和印度教比賽之外,我並沒有特別參加任何比賽:我不明白這有什麼意義,因為我在機器學習領域工作過,而且我很熟悉它。 我作為學生參加的第一學期。 從第二學期開始,一旦計算資源可用,我就想,為什麼不參加呢? 它讓我著迷。 任務、數據和指標是為您發明和準備的,繼續使用 MO 的全部功能,檢查最先進的模型和技術。 如果沒有培訓,以及同樣重要的計算資源,我不會很快開始參與。”

安德烈·舍維列夫
「面對面的機器學習培訓幫助我找到了志同道合的人,與他們一起加深了我在機器學習和數據分析領域的知識。 對於那些沒有太多空閒時間獨立分析和沈浸在比賽話題中,但仍想融入話題的人來說,這也是一個絕佳的選擇。”

Присоединяйтеськнам

Kaggle 和其他平台上的競賽磨練了實用技能,並迅速轉化為資料科學領域有趣的工作。 一起參與艱難競爭的人往往會成為同事,並不斷成功地解決與工作相關的問題。 這也發生在我們身上:米哈伊爾·卡切夫斯基(Mikhail Karchevsky)和團隊中的一位朋友一起為同一家公司的推薦系統工作。

隨著時間的推移,我們計劃透過科學出版物和參與機器學習會議來擴大這項活動。 加入我們作為新西伯利亞的參與者或專家 - 寫 基里爾。 在您所在的城市和大學組織類似的培訓。

這是一個小備忘單,可幫助您踏出第一步:

  1. 考慮一個方便的地點和時間進行常規課程。 最佳 - 每週 1-2 次。
  2. 寫信給潛在有興趣的參與者有關第一次會議的資訊。 首先,他們是技術大學的學生,ODS 參與者。
  3. 開始聊天討論時事:Telegram、VK、WhatsApp 或任何其他對大多數人來說方便的通訊工具。
  4. 維護可公開存取的課程計劃、競賽和參與者列表,並監控結果。
  5. 在附近的大學、研究機構或公司尋找免費的運算能力或補助。
  6. 利潤!

資料來源:www.habr.com

添加評論