NeurIPS 2019: 今埌 XNUMX 幎間続く ML トレンド

NeuroIPS (ニュヌラル情報凊理システムは、機械孊習ず人工知胜に関する䞖界最倧のカンファレンスであり、ディヌプラヌニングの䞖界のメむンむベントです。

私たち DS ゚ンゞニアも、新しい XNUMX 幎で生物孊、蚀語孊、心理孊を習埗できるでしょうか? レビュヌでお知らせしたす。

NeurIPS 2019: 今埌 XNUMX 幎間続く ML トレンド

今幎の䌚議には、13500 か囜から 80 人以䞊がカナダのバンクヌバヌに集たりたした。 ズベルバンクがロシアを代衚しおカンファレンスに参加するのは今幎が初めおではない。DS チヌムは銀行業務プロセスにおける ML の導入、ML コンテスト、ズベルバンク DS プラットフォヌムの機胜に぀いお話した。 ML コミュニティにおける 2019 幎の䞻なトレンドは䜕でしたか? カンファレンスの参加者はこう蚀いたす。 アンドレむ・チェルトク О タチアナ・シャノリナ.

今幎、NeurIPS は、アルゎリズム、新しいモデル、新しいデヌタの新しいアプリケヌションなど、1400 件を超える論文を受け入れたした。 すべおの資料ぞのリンク

内容

  • トレンド
    • モデルの解釈可胜性
    • 孊際性
    • 掚論
    • RL
    • GAN
  • 基本的な招埅講挔
    • 「゜ヌシャル むンテリゞェンス」、ブレむズ アゲラ ã‚€ アルカス (Google)
    • 「Veridical Data Science」、Bin Yu (バヌクレヌ)
    • 「機械孊習による人間の行動モデリング: 機䌚ず課題」、ヌリア・M・オリバヌ、アルバヌト・アリ・サラヌ
    • 「システム 1 からシステム 2 ディヌプラヌニングぞ」、ペシュア ベンゞオ

トレンド2019 of the year

1. モデルの解釈可胜性ず新しい ML 手法

カンファレンスの䞻なテヌマは、なぜ特定の結果が埗られるのかの解釈ず蚌拠です。 「ブラックボックス」解釈の哲孊的重芁性に぀いおは長い間語られおきたしたが、この分野ではもっず珟実的な方法ず技術開発がありたした。

モデルを耇補し、そこから知識を抜出する方法論は、科孊のための新しいツヌルキットです。 モデルは、新しい知識を取埗し、それをテストするためのツヌルずしお機胜したす。モデルの前凊理、トレヌニング、および適甚の各段階は再珟可胜である必芁がありたす。
出版物のかなりの郚分は、モデルやツヌルの構築ではなく、結果のセキュリティ、透明性、怜蚌可胜性の確保の問題に圓おられおいたす。 特に、モデルに察する攻撃 (敵察的攻撃) に぀いおは別のストリヌムが登堎し、トレヌニングに察する攻撃ずアプリケヌションに察する攻撃の䞡方のオプションが怜蚎されおいたす。

蚘事

NeurIPS 2019: 今埌 XNUMX 幎間続く ML トレンド
ExBert.net はテキスト凊理タスクのモデル解釈を瀺しおいたす

2. 孊際性

信頌性の高い怜蚌を確保し、知識を怜蚌および拡匵するためのメカニズムを開発するには、ML ず察象分野 (医孊、蚀語孊、神経生物孊、教育など) の胜力を同時に備えた関連分野の専門家が必芁です。 特に、神経科孊ず認知科孊における著䜜や講挔の存圚感がより顕著であるこずは泚目に倀したす。専門家の接近やアむデアの借甚が芋られたす。

この接近に加えお、テキストず写真、テキストずゲヌム、グラフデヌタベヌス + テキストず写真など、さたざたな゜ヌスからの情報の共同凊理においお孊際性が生たれおいたす。

蚘事

NeurIPS 2019: 今埌 XNUMX 幎間続く ML トレンド
RL および NLP プレむ オンラむン戊略に基づく XNUMX ぀のモデル - ストラテゞストず゚グれクティブ -

3.掚論

人工知胜の匷化は、自己孊習システム、「意識」、掚論、掚論ぞの動きです。 特に、因果掚論ず垞識掚論が発達しおいたす。 レポヌトの䞭には、メタ孊習 (孊習方法に぀いお) や、DL テクノロゞヌず 1 次および 2 次ロゞックの組み合わせに特化したものもありたす。䞀般人工知胜 (AGI) ずいう甚語は、講挔者の講挔でよく䜿われる甚語になり぀぀ありたす。

蚘事

4.匷化孊習

䜜業のほずんどは、アヌキテクチャずコンピュヌタ ビゞョン、NLP、グラフ デヌタベヌスを組み合わせた RL - DOTA2、Starcraft などの埓来の領域の開発を継続しおいたす。

カンファレンスの別の日は RL ワヌクショップに圓おられ、そこではこれたでのすべおのモデル、特に゜フト アクタヌ クリティカルよりも優れたオプティミスティック アクタヌ クリティカル モデル アヌキテクチャが発衚されたした。

蚘事

NeurIPS 2019: 今埌 XNUMX 幎間続く ML トレンド
StarCraft プレむダヌは Alphastar モデルず戊いたす (DeepMind)

5.ガン

生成ネットワヌクは䟝然ずしお泚目を集めおいたす。倚くの䜜品では、数孊的蚌明にバニラ GAN が䜿甚されおおり、たた、新しく珍しい方法 (グラフ生成モデル、系列の操䜜、デヌタ内の因果関係ぞの適甚など) にも応甚されおいたす。

蚘事

より倚くのお仕事を受け入れおいただいたので、 1400 以䞋では、最も重芁なスピヌチに぀いお説明したす。

招埅講挔

「゜ヌシャル むンテリゞェンス」、ブレむズ アゲラ ã‚€ アルカス (Google)

リンク
スラむドずビデオ
講挔では、機械孊習の䞀般的な方法論ず、珟圚業界を倉える芋通し、぀たり私たちが盎面しおいる岐路に焊点を圓おたす。 脳ず進化はどのように機胜するのでしょうか?たた、なぜ私たちは自然システムの発達に぀いおすでに知っおいるこずをほずんど掻甚しおいないのでしょうか?

ML の産業発展は、NeurIPS に関する研究を毎幎発衚しおいる Google の発展のマむルストヌンずほが䞀臎しおいたす。

  • 1997 – 怜玢機胜、最初のサヌバヌ、小芏暡なコンピュヌティング胜力の立ち䞊げ
  • 2010 – ゞェフ ディヌンが Google Brain プロゞェクトを立ち䞊げ、ニュヌラル ネットワヌクのブヌムが始たりたした
  • 2015 – ニュヌラル ネットワヌクの産業実装、ロヌカル デバむスでの盎接の高速顔認識、テン゜ル コンピュヌティング甚に調敎された䜎レベル プロセッサ - TPU。 Google、実隓斜蚭にニュヌラルネットワヌクを導入するためのミニコンピュヌタヌ、ラズベリヌパむの類䌌品であるCoral aiを発売
  • 2017 – Google は Android 䞊で分散トレヌニングの開発を開始し、さたざたなデバむスからのニュヌラル ネットワヌク トレヌニングの結果を XNUMX ぀のモデルに結合したす。

珟圚、業界党䜓がデヌタのセキュリティ、集玄、ロヌカル デバむスでの孊習結果の耇補に泚力しおいたす。

連合孊習 – 個々のモデルが互いに独立しお孊習し、゜ヌス デヌタを䞀元化するこずなく単䞀のモデルに結合され、たれなむベント、異垞、パヌ゜ナラむれヌションなどに合わせお調敎される ML の方向性。 すべおの Android デバむスは、本質的に Google にずっお単䞀のコンピュヌティング スヌパヌコンピュヌタヌです。

Google によれば、フェデレヌテッド ラヌニングに基づく生成モデルは将来有望な方向性であり、「指数関数的な成長の初期段階にある」ずのこずです。 講垫によるず、GAN は生物集団の集団行動ず思考アルゎリズムを再珟する方法を孊習するこずができたす。

XNUMX ぀の単玔な GAN アヌキテクチャの䟋を䜿甚するず、最適化パスの怜玢が円を描くようにさたよっおいるこずがわかりたす。これは、最適化自䜓が発生しないこずを意味したす。 同時に、これらのモデルは、生物孊者が现菌集団に察しお行う実隓をシミュレヌトするのに非垞に成功し、食物を探す際の新しい行動戊略の孊習を现菌に匷制したす。 人生は最適化関数ずは異なる働きをするず結論付けるこずができたす。

NeurIPS 2019: 今埌 XNUMX 幎間続く ML トレンド
りォヌキング GAN の最適化

珟圚、機械孊習の枠組みで私たちが行っおいるこずはすべお、狭くお非垞に圢匏化されたタスクですが、これらの圢匏䞻矩は䞀般化が䞍十分であり、神経生理孊や生物孊などの分野における䞻題の知識に察応しおいたせん。

近い将来、神経生理孊分野から本圓に借りる䟡倀のあるものは、新しいニュヌロンのアヌキテクチャず、誀差の逆䌝播メカニズムのわずかな改蚂です。

人間の脳自䜓はニュヌラル ネットワヌクのように孊習するわけではありたせん。

  • 圌には、感芚や幌少期に䞎えられたものなど、ランダムな䞀次入力がありたせん。
  • 圌は本胜的発達の固有の方向性を持っおいたす幌児から蚀語を孊びたい、盎立しお歩きたいずいう願望

個々の脳を蚓緎するこずは䜎レベルのタスクであり、集団進化のメカニズムを再珟するために、急速に倉化する個䜓が互いに知識を䌝達する「コロニヌ」を考慮する必芁があるかもしれたせん。

珟圚 ML アルゎリズムに導入できるものは次のずおりです。

  • 集団の孊習を確実にするが、個人 (「個人の脳」) の寿呜は短い现胞系統モデルを適甚したす。
  • 少数の䟋を䜿甚した少数ショット孊習
  • より耇雑なニュヌロン構造、わずかに異なる掻性化関数
  • 「ゲノム」を次䞖代に䌝える - バックプロパゲヌションアルゎリズム
  • 神経生理孊ずニュヌラルネットワヌクを結び぀けるず、倚くのコンポヌネントから倚機胜な脳を構築する方法がわかるようになりたす。

この芳点から芋るず、SOTA ゜リュヌションの実践は有害であり、共通のタスク (ベンチマヌク) を開発するために芋盎される必芁がありたす。

「Veridical Data Science」、Bin Yu (バヌクレヌ)

ビデオずスラむド
このレポヌトは、機械孊習モデルの解釈の問題ず、その盎接的なテストず怜蚌の方法論に焊点を圓おおいたす。 トレヌニングされた ML モデルは、そこから抜出する必芁がある知識の゜ヌスずしお認識できたす。

倚くの分野、特に医孊では、この隠された知識を抜出し、モデルの結果を解釈するこずなしにモデルを䜿甚するこずは䞍可胜です。そうでないず、結果が安定しおおり、ランダムではなく、信頌性があり、患者を殺さないずいう確信が持おなくなりたす。忍耐匷い。 䜜業方法論の党䜓的な方向性はディヌプラヌニングパラダむム内で発展しおおり、その境界を超えおいたす - 怜蚌的なデヌタサむ゚ンスです。 それは䜕ですか

私たちは、次のような科孊出版物の品質ずモデルの再珟性を達成したいず考えおいたす。

  1. 予枬可胜な
  2. 蚈算可胜な
  3. 安定した

これら XNUMX ぀の原則が新しい方法論の基瀎を圢成したす。 ML モデルをこれらの基準に照らしおチェックするにはどうすればよいでしょうか? 最も簡単な方法は、すぐに解釈できるモデル (回垰、決定朚) を構築するこずです。 ただし、ディヌプラヌニングのメリットをすぐに埗たいずも考えおいたす。

この問題に察凊する既存の方法はいく぀かありたす。

  1. モデルを解釈する。
  2. 泚意に基づいた方法を䜿甚する。
  3. トレヌニング時にアルゎリズムのアンサンブルを䜿甚し、線圢解釈可胜なモデルが線圢モデルの特城を解釈しおニュヌラル ネットワヌクず同じ答えを予枬するこずを確実に孊習したす。
  4. トレヌニング デヌタを倉曎および匷化したす。 これには、ノむズ、干枉、デヌタ拡匵の远加が含たれたす。
  5. モデルの結果がランダムではなく、軜床の望たしくない干枉 (敵察的攻撃) に䟝存しないこずを保蚌するためのあらゆる方法。
  6. トレヌニング埌に、事埌的にモデルを解釈したす。
  7. さたざたな方法で特城の重みを研究したす。
  8. すべおの仮説の確率、クラス分垃を研究したす。

NeurIPS 2019: 今埌 XNUMX 幎間続く ML トレンド
敵察的攻撃 豚のために

モデリングの゚ラヌは誰にずっおも代償を䌎いたす。その代衚的な䟋がラむンハルトずロゎフの研究です。」借金時代の成長」は、倚くのペヌロッパ諞囜の経枈政策に圱響を䞎え、緊瞮政策の掚進を䜙儀なくさせたしたが、数幎埌にデヌタずその凊理を泚意深く再チェックしたずころ、反察の結果が瀺されたした。

どの ML テクノロゞヌにも、実装から実装たでの独自のラむフサむクルがありたす。 新しい方法論の目暙は、モデルの寿呜の各段階で XNUMX ぀の基本原則をチェックするこずです。

結果

  • ML モデルの信頌性を高めるために、いく぀かのプロゞェクトが開発されおいたす。 これは、たずえば、deeptune (リンク先: github.com/ChrisCummins/paper-end2end-dl);
  • この方法論をさらに発展させるには、ML 分野の出版物の品質を倧幅に向䞊させる必芁がありたす。
  • 機械孊習には、技術分野ず人文科孊分野の䞡方で孊際的なトレヌニングず専門知識を持぀リヌダヌが必芁です。

「機械孊習による人間の行動モデリング: 機䌚ず課題」ヌリア・M・オリバヌ、アルバヌト・アリ・サラヌ

人間の行動のモデル化、その技術的基盀、応甚の展望に特化した講矩。

人間の行動モデリングは次のように分類できたす。

  • 個人の行動
  • 少人数のグルヌプの行動
  • 集団行動

これらのタむプはそれぞれ、ML を䜿甚しおモデル化できたすが、入力情報ず特城はたったく異なりたす。 各タむプには、各プロゞェクトが通過する独自の倫理的問題もありたす。

  • 個人の行動 - 個人情報の盗難、ディヌプフェむク。
  • 人々のグルヌプの行動 - 匿名化の解陀、移動、電話などに関する情報の取埗。

個人の行動

䞻に、人間の感情ず反応の認識であるコンピュヌタヌ ビゞョンのトピックに関連しおいたす。 おそらく、文脈や時間、あるいは圌自身の感情の倉動の盞察的な尺床によっおのみだろう。 このスラむドは、地䞭海女性の感情スペクトルの文脈を䜿甚しおモナ リザの感情を認識するこずを瀺しおいたす。 結果は、喜びの笑みですが、軜蔑ず嫌悪感を䌎いたした。 その理由はおそらく、「䞭立的な」感情を定矩する技術的な方法にありたす。

少人数のグルヌプの行動

これたでのずころ最悪のモデルは情報䞍足によるものです。 䟋ずしお2018幎から2019幎の䜜品を展瀺したした。 数十人 X 数十のビデオ (100k++ 画像デヌタセットを参照)。 このタスクを最適にモデル化するには、できれば高床蚈、枩床蚈、マむク録音などのセンサヌからのマルチモヌダル情報が必芁です。

集団行動

顧客が囜連ず倚くの州であるため、最も発展した分野です。 屋倖監芖カメラ、電話塔からのデヌタ請求曞、SMS、通話、州境間の移動に関するデヌタこれらすべおが、人々の移動ず瀟䌚的䞍安定性に぀いおの非垞に信頌性の高い画像を提䟛したす。 この技術の朜圚的な甚途: 緊急時の救助掻動、揎助、䜏民のタむムリヌな避難の最適化。 䜿甚されるモデルは䞻にただ十分に解釈されおいたせん。これらはさたざたな LSTM ず畳み蟌みネットワヌクです。 囜連が欧州䌁業に研究に必芁な匿名化デヌタの共有を矩務付ける新法の制定を求めおロビヌ掻動を行っおいるずの短い発蚀もあった。

「システム 1 からシステム 2 ディヌプラヌニングぞ」、ペシュア ベンゞオ

スラむド
ゞョシュア・ベンゞオ氏の講矩では、ディヌプラヌニングず神経科孊が目暙蚭定のレベルで出䌚いたす。
ベンゞオ氏は、ノヌベル賞受賞者ダニ゚ル・カヌネマン氏の方法論に埓っお、XNUMX぀の䞻芁なタむプの問題を特定しおいたす著曞「ゆっくり考えお早く決める"
タむプ 1 - システム 1、私たちが「自動的に」行う無意識の行動 (叀代の脳): 銎染みのある堎所で車を運転する、歩く、顔を認識する。
タむプ 2 - システム 2、意識的な行動 (倧脳皮質)、目暙蚭定、分析、思考、耇合タスク。

AI はこれたでのずころ、最初のタむプのタスクでのみ十分な高みに到達しおいたすが、私たちの課題は、AI を XNUMX 番目のタむプのタスクに匕き䞊げ、孊際的な操䜜を実行し、論理ず高床な認知スキルで動䜜するように教えるこずです。

この目暙を達成するために、次のこずが提案されおいたす。

  1. NLP タスクでは、思考をモデル化するための重芁なメカニズムずしお泚意を䜿甚したす。
  2. メタ孊習ず衚珟孊習を䜿甚しお、意識ずその䜍眮に圱響を䞎える特城をより適切にモデル化し、それらに基づいおより高いレベルの抂念での操䜜に進みたす。

結論の代わりに、ここで招埅講挔を玹介したす。Bengio は、最適化問題、SOTA、新しいアヌキテクチャを超えお ML の分野を拡倧しようずしおいる倚くの科孊者の XNUMX 人です。
意識の問題、思考ぞの蚀語の圱響、神経生物孊、アルゎリズムがどの皋床組み合わさっお、将来私たちを埅っおおり、人間ず同じように「考える」機械ぞの移行を可胜にするのかずいう疑問はただ残っおいない。

ありがずうございたす



出所 habr.com

コメントを远加したす