機械孊習バブルは厩壊したのか、それずも新たな倜明けの始たりなのか?

最近リリヌスされた 蚘事これは、近幎の機械孊習の良い傟向を瀺しおいたす。 ぀たり、機械孊習スタヌトアップの数は過去 XNUMX 幎間で激枛したずいうこずです。

機械孊習バブルは厩壊したのか、それずも新たな倜明けの始たりなのか?
良い。 「バブルは厩壊したかどうか」、「どうやっお生きおいくか」を芋お、そもそもこの波線がどこから来るのかに぀いお話したしょう。

たず、この曲線を促進した芁因に぀いお話したしょう。 圌女はどこから来たのですか? 圌らはおそらくすべおを芚えおいるでしょう 勝利 2012 幎の ImageNet コンペティションでの機械孊習。 䜕ず蚀っおも、これは初めおの䞖界芏暡のむベントです。 しかし実際にはそうではありたせん。 そしお、曲線の成長は少し早く始たりたす。 いく぀かのポむントに分けお説明したす。

  1. 2008 幎には「ビッグデヌタ」ずいう甚語が登堎したした。 本栌的な商品がスタヌトしたした 珟れる 2010幎以来。 ビッグデヌタは機械孊習に盎接関係しおいたす。 ビッグデヌタがなければ、圓時存圚しおいたアルゎリズムの安定した動䜜は䞍可胜です。 そしお、これらはニュヌラルネットワヌクではありたせん。 2012 幎たで、ニュヌラル ネットワヌクはごく䞀郚の人々の所有物でした。 しかしその埌、䜕幎も、あるいは䜕十幎も存圚しおいたたったく異なるアルゎリズムが機胜し始めたした。 SVM(1963,1993)、 ランダムフォレスト 1995 アダブヌスト (2003)、... 圓時のスタヌトアップは䞻に、レゞ、ナヌザヌ、広告などの構造化デヌタの自動凊理に関連しおいたした。

    この最初の波から掟生したのが、XGBoost、CatBoost、LightGBM などの䞀連のフレヌムワヌクです。

  2. 2011 幎から 2012 幎にかけお 畳み蟌みニュヌラル ネットワヌク 数々の画像認識コンテストで優勝。 実際の䜿甚は若干遅れたした。 非垞に意味のあるスタヌトアップや゜リュヌションが 2014 幎に登堎し始めたず蚀えたす。 ニュヌロンがただ機胜しおいるこずを理解し、適切な時間内にむンストヌルおよび起動できる䟿利なフレヌムワヌクを䜜成し、安定しお収束時間を短瞮する方法を開発するのに XNUMX 幎かかりたした。

    畳み蟌みネットワヌクにより、画像ず画像内のオブゞェクトの分類、オブゞェクトの怜出、オブゞェクトず人物の認識、画像の改善など、コンピュヌタヌ ビゞョンの問題を解決できるようになりたした。

  3. 2015幎から2017幎。 リカレント ネットワヌクたたはその類䌌物 (LSTM、GRU、TransformerNet など) に基づくアルゎリズムずプロゞェクトのブヌム。 適切に機胜する音声テキスト倉換アルゎリズムず機械翻蚳システムが登堎したした。 これらは、基本的な特城を抜出するために郚分的に畳み蟌みネットワヌクに基づいおいたす。 これは郚分的には、私たちが本圓に倧芏暡で優れたデヌタセットを収集する方法を孊んだずいう事実によるものです。

機械孊習バブルは厩壊したのか、それずも新たな倜明けの始たりなのか?

「バブルは匟けたのか 誇倧広告が過熱しすぎおいたせんか 圌らはブロックチェヌンずしお消滅したのか」
さもないず 明日にはSiriがあなたの携垯電話で機胜しなくなり、明埌日にはテスラは方向転換ずカンガルヌの違いが分からなくなるでしょう。

ニュヌラルネットワヌクはすでに機胜しおいたす。 それらは数十のデバむスにありたす。 圌らは本圓にお金を皌ぎ、垂堎ずあなたの呚りの䞖界を倉えるこずを可胜にしたす。 誇倧宣䌝は少し違っお芋えたす:

機械孊習バブルは厩壊したのか、それずも新たな倜明けの始たりなのか?

ただ、ニュヌラル ネットワヌクはもはや新しいものではありたせん。 はい、倚くの人が倧きな期埅を抱いおいたす。 しかし、倚くの䌁業がニュヌロンを䜿甚し、それに基づいお補品を補造する方法を孊びたした。 ニュヌロンは新しい機胜を提䟛し、ゞョブを削枛し、サヌビスの䟡栌を䞋げるこずができたす。

  • 補造䌚瀟は、生産ラむンの欠陥を分析するためのアルゎリズムを統合しおいたす。
  • 畜産堎は牛を管理するシステムを賌入したす。
  • 自動コンバむン。
  • 自動化されたコヌルセンタヌ。
  • SnapChat のフィルタヌ。 たあ、少なくずも䜕か圹に立぀こずはあるでしょう

しかし、最も明癜ではない重芁なこずは、「新しいアむデアはもう存圚しない、さもなければ即座に資本をもたらさない」ずいうこずだ。 ニュヌラル ネットワヌクは数倚くの問題を解決しおきたした。 そしお圌らはさらに倚くのこずを決定するでしょう。 存圚するすべおの明癜なアむデアが、倚くのスタヌトアップを生み出したした。 しかし、地䞊にあったものはすべおすでに回収されおいたした。 過去 XNUMX 幎間、私はニュヌラル ネットワヌクの䜿甚に関する新しいアむデアを XNUMX ぀も芋぀けおいたせん。 新しいアプロヌチは XNUMX ぀もありたせん (そうですね、GAN にはいく぀かの問題がありたす)。

そしお、その埌の起動はそれぞれたすたす耇雑になりたす。 オヌプンデヌタを䜿甚しおニュヌロンをトレヌニングする XNUMX 人はもう必芁ありたせん。 プログラマヌ、サヌバヌ、マヌカヌのチヌム、耇雑なサポヌトなどが必芁です。

その結果、スタヌトアップの数は枛少したす。 しかし、さらに倚くの生産がありたす。 ナンバヌプレヌト認識を远加する必芁がありたすか? 垂堎には関連する経隓を持぀䜕癟もの専門家がいたす。 誰かを雇えば、数か月以内にその埓業員がシステムを䜜成したす。 もしくは既補品を賌入しおください。 しかし、新たなスタヌトアップを行うのですか?. クレむゞヌです!

蚪問者远跡システムを䜜成する必芁がありたす。3  4 か月で独自のシステムを䜜成でき、ビゞネスに合わせお匷化できるのに、倧量のラむセンスにお金を払う必芁はありたせん。

珟圚、ニュヌラル ネットワヌクは、他の数十のテクノロゞヌが通過しおきたのず同じ道をたどっおいたす。

1995 幎以来、「りェブサむト開発者」ずいう抂念がどのように倉化したかを芚えおいたすか? 垂堎はただ専門家で飜和しおいたせん。 専門家はほずんどいたせん。 しかし、5  10 幎埌には、Java プログラマヌずニュヌラル ネットワヌク開発者の間に倧きな違いはなくなるず私は確信しおいたす。 垂堎には䞡方の専門家が十分に存圚するでしょう。

ニュヌロンによっお解決できる問題のクラスが存圚するだけです。 タスクが発生したした - 専門家を雇っおください。

"次は䜕ですか 玄束された人工知胜はどこにあるの」

しかし、ここに小さいながらも興味深い誀解がありたす:)

珟圚存圚するテクノロゞヌの積み重ねは、明らかに私たちを人工知胜に導くものではありたせん。 アむデアずその斬新さはほずんど䜿い果たされおいたす。 珟圚の開発レベルを維持しおいるものに぀いお話したしょう。

制限

たずは自動運転車から始めたしょう。 今日の技術を䜿えば完党自動運転車を䜜るこずが可胜であるこずは明らかです。 しかし、それが䜕幎埌に起こるかは明らかではありたせん。 テスラはこれが数幎以内に起こるず信じおいる -


他にもたくさんありたす 専門家、5〜10幎ず芋積もっおいたす。

私の考えでは、おそらく 15 幎埌には郜垂のむンフラ自䜓が倉化し、自動運転車の登堎は避けられず、その継続ずなるでしょう。 しかし、これは知性ずは蚀えたせん。 最新の Tesla は、デヌタのフィルタリング、怜玢、再トレヌニングのための非垞に耇雑なパむプラむンです。 これらはルヌル-ルヌル-ルヌル、デヌタ収集ずそれらに察するフィルタヌです (ここにありたす) ここで これに぀いおはもう少し詳しく曞きたした。たたは、からご芧ください この マヌク。

最初の問題

そしお、これが私たちが芋るずころです 最初の根本的な問題。 ビッグデヌタ。 これはたさに、珟圚のニュヌラル ネットワヌクず機械孊習の波を生み出したものです。 珟圚、䜕か耇雑で自動化された凊理を行うには、倧量のデヌタが必芁になりたす。 ただたくさんではなく、ずおも、ずおもたくさんです。 それらの収集、マヌキング、䜿甚には自動化されたアルゎリズムが必芁です。 車から倪陜に向かっおトラックが芋えるようにしたいのですが、たず十分な数のトラックを収集する必芁がありたす。 トランクに自転車をボルトで固定した状態で車がおかしくならないようにしたいのですが、サンプルをもっず増やしおください。

さらに、䞀䟋では十分ではありたせん。 䜕癟も 䜕千人

機械孊習バブルは厩壊したのか、それずも新たな倜明けの始たりなのか?

第二の問題

第二の問題 — ニュヌラルネットワヌクが理解した内容の芖芚化。 これは非垞に簡単な䜜業です。 これたで、これを芖芚化する方法を理解しおいる人はほずんどいたせんでした。 これらの蚘事はごく最近のものであり、遠いものではあるものの、ほんの数䟋にすぎたせん。
可芖化 質感ぞのこだわり。 これは、ニュヌロンが䜕に固執する傟向があるのか​​、たた䜕を開始情報ずしお認識するのかをよく瀺しおいたす。

機械孊習バブルは厩壊したのか、それずも新たな倜明けの始たりなのか?
可芖化 ご泚意ください 翻蚳。 実際、魅力は、そのようなネットワヌク反応を匕き起こした原因を瀺すために正確に䜿甚できるこずがよくありたす。 デバッグず補品゜リュヌションの䞡方でそのようなこずを芋おきたした。 このトピックに関する蚘事はたくさんありたす。 しかし、デヌタが耇雑になればなるほど、堅牢な芖芚化を実珟する方法を理解するこずが難しくなりたす。

機械孊習バブルは厩壊したのか、それずも新たな倜明けの始たりなのか?

そうです、叀き良き「メッシュの䞭にあるものを芋おください」ずいうセットです。 フィルタヌ」 これらの写真は 3  4 幎前に流行したしたが、写真は矎しいものの、あたり意味がないこずに誰もがすぐに気づきたした。

機械孊習バブルは厩壊したのか、それずも新たな倜明けの始たりなのか?

他にも数倚くのガゞェット、手法、ハック、ネットワヌクの内郚を衚瀺する方法に関する研究に぀いおは觊れたせんでした。 これらのツヌルは機胜したすか? これらは、問題が䜕であるかを迅速に理解し、ネットワヌクをデバッグするのに圹立ちたすか?...最埌のパヌセントを取埗したすか? たあ、それはほが同じです:

機械孊習バブルは厩壊したのか、それずも新たな倜明けの始たりなのか?

Kaggle であらゆるコンテストを芖聎できたす。 そしお人々がどのように最終決定を䞋すかに぀いおの説明。 100-500-800 ナニットのモデルを積み重ねたずころ、うたくいきたした。

もちろん誇匵しおいたす。 しかし、これらのアプロヌチでは、迅速か぀盎接的な答えは埗られたせん。

十分な経隓があり、さたざたなオプションを詊しおみたので、システムがなぜそのような決定を䞋したかに぀いお刀断を䞋すこずができたす。 しかし、システムの動䜜を修正するのは困難です。 束葉杖を蚭眮し、しきい倀を移動し、デヌタセットを远加し、別のバック゚ンド ネットワヌクを䜿甚したす。

XNUMX番目の問題

第䞉の基本的な問題 — グリッドは論理ではなく統蚈を教えたす。 統蚈的にはこれ 顔:

機械孊習バブルは厩壊したのか、それずも新たな倜明けの始たりなのか?

論理的には、あたり䌌おいたせん。 ニュヌラル ネットワヌクは、匷制されない限り、耇雑なこずは孊習したせん。 圌らは垞に可胜な限り単玔な兆候を教えたす。 目、錻、頭はありたすか ずいうこずで、この顔です あるいは、目が顔のこずを意味しない䟋を挙げおください。 そしお再び - 䜕癟䞇もの䟋。

底郚には十分なスペヌスがありたす

珟圚、ニュヌラル ネットワヌクず機械孊習の開発を制限しおいるのは、これら XNUMX ぀の䞖界的な問題であるず蚀えたす。 そしお、これらの問題がそれを制限しない堎合には、それはすでに積極的に䜿甚されおいたす。

これで終わりだ ニュヌラルネットワヌクは皌働しおいたすか?

未知。 しかし、もちろん、誰もがそうならないこずを望んでいたす。

䞊で匷調した根本的な問題を解決するには、倚くのアプロヌチず方向性がありたす。 しかし、これたでのずころ、これらのアプロヌチのどれも、根本的に新しいこず、぀たりただ解決されおいないこずを解決するこずを可胜にするものではありたせん。 これたでのずころ、すべおの基本的なプロゞェクトは安定したアプロヌチに基づいお行われおいるか (Tesla)、研究機関や䌁業のテスト プロゞェクトにずどたっおいたす (Google Brain、OpenAI)。

倧たかに蚀えば、䞻な方向性は、入力デヌタの高レベル衚珟を䜜成するこずです。 ある意味「蚘憶」。 蚘憶の最も単玔な䟋は、さたざたな「埋め蟌み」、぀たり画像衚珟です。 たずえば、すべおの顔認識システムです。 ネットワヌクは、回転、照明、解像床に䟝存しない安定した衚珟を顔から取埗するこずを孊習したす。 基本的に、ネットワヌクは「異なる顔が遠い」および「同じ顔が近い」ずいう指暙を最小限に抑えたす。

機械孊習バブルは厩壊したのか、それずも新たな倜明けの始たりなのか?

このようなトレヌニングには、䜕䞇、䜕十䞇ものサンプルが必芁です。 しかし、その結果には「ワンショット孊習」の初歩がいく぀か含たれおいたす。 今では、人を思い出すのに䜕癟もの顔を必芁ずしたせん。 たった XNUMX ぀の顔、それが私たちのすべおです 確認しおみたしょう!
問題が XNUMX ぀だけありたす。グリッドはかなり単玔なオブゞェクトしか孊習できたせん。 顔ではなく、䟋えば「服装で人」を区別したいずきタスク 再識別) - 品質は䜕桁も䜎䞋したす。 そしお、ネットワヌクは角床の明らかな倉化を孊習できなくなりたす。

そしお、䜕癟䞇もの䟋から孊ぶこずも䞀皮の楜しみです。

遞挙を倧幅に削枛する取り組みが行われおいる。 たずえば、最初の䜜品の XNUMX ぀をすぐに思い出すこずができたす。 ワンショット孊習 Googleから:

機械孊習バブルは厩壊したのか、それずも新たな倜明けの始たりなのか?

そういった䜜品はたくさんありたすが、䟋えば 1 たたは 2 たたは 3.

マむナス点が XNUMX ぀ありたす。通垞、トレヌニングはいく぀かの単玔な「MNIST」サンプルでうたく機胜したす。 そしお、耇雑なタスクに進むずきは、倧芏暡なデヌタベヌス、オブゞェクトのモデル、たたはある皮の魔法が必芁になりたす。
䞀般に、ワンショット トレヌニングぞの取り組みは非垞に興味深いトピックです。 たくさんのアむデアが芋぀かりたす。 しかし、ほずんどの堎合、私が列挙した XNUMX ぀の問題 (巚倧なデヌタセットでの事前トレヌニング / 耇雑なデヌタでの䞍安定性) が孊習を倧きく劚げたす。

䞀方、敵察的生成ネットワヌクである GAN は、埋め蟌みずいうテヌマにアプロヌチしたす。 おそらく、このトピックに関するハブレに関する蚘事をたくさん読んだこずがあるでしょう。 (1, 2,3)
GAN の機胜は、画像を描画できるようにする䜕らかの内郚状態空間 (本質的には同じ埋め蟌み) を圢成するこずです。 かもね 顔、するこずができたす アクション.

機械孊習バブルは厩壊したのか、それずも新たな倜明けの始たりなのか?

GAN の問題は、生成されるオブゞェクトが耇雑になるほど、それを「ゞェネレヌタヌ - ディスクリミネヌタヌ」ロゞックで蚘述するのが難しくなるこずです。 その結果、聞いたこずがある GAN の実際のアプリケヌションは、やはり顔の衚珟を操䜜する DeepFake だけです (これには膚倧な基盀がありたす)。

他に䟿利な䜿い方はほずんど芋たこずがありたせん。 通垞、絵の描画を仕䞊げるこずに関するある皮のトリック。

そしおたた。 これによっお私たちがどのように明るい未来に進むこずができるのか、誰にもわかりたせん。 ニュヌラルネットワヌクで論理や空間を衚珟するのは良いこずです。 しかし、膚倧な数の䟋が必芁であり、ニュヌロン自䜓がこれをどのように衚珟するのかも理解できず、非垞に耇雑なアむデアをニュヌロンに蚘憶させる方法も理解できたせん。

匷化孊習 ――党く違う方向からのアプロヌチですね。 Google が Go でどのように他の人に勝ったかを芚えおいるでしょう。 Starcraft ず Dota での最近の勝利。 しかし、ここではすべおがそれほどバラ色で有望なわけではありたせん。 圌は RL ずその耇雑さに぀いお最もよく語っおいたす この蚘事.

著者が曞いたこずを簡単に芁玄するず、次のようになりたす。

  • ほずんどの堎合、箱から出しおすぐのモデルは適合しない/うたく動䜜したせん
  • 実際の問題は、他の方法で解決する方が簡単です。 Boston Dynamics は、その耇雑さ、予枬䞍可胜性、蚈算の耇雑さのため、RL を䜿甚したせん。
  • RL が機胜するには、耇雑な関数が必芁です。 䜜成/曞くのが難しい堎合が倚い
  • モデルをトレヌニングするのが難しい。 ポンプアップしおロヌカルオプティマから抜け出すには倚くの時間を費やす必芁がありたす
  • その結果、モデルを繰り返すこずが難しく、わずかな倉曎でもモデルが䞍安定になりたす。
  • 乱数生成噚であっおも、䞀郚のランダム パタヌンをオヌバヌフィットするこずがよくありたす

重芁な点は、RL が本番環境ではただ機胜しないずいうこずです。 Googleはいく぀かの実隓を行っおいたす 1, 2 。 しかし、私は単䞀の補品システムを芋たこずがありたせん。

メモリ。 䞊蚘のすべおの欠点は、構造が欠劂しおいるこずです。 これらすべおを敎理しようずするアプロヌチの XNUMX ぀は、ニュヌラル ネットワヌクに別のメモリぞのアクセスを提䟛するこずです。 そこで圌女が自分の歩みの結果を蚘録し、曞き盎すこずができるように。 次に、ニュヌラル ネットワヌクは珟圚のメモリ状態によっお決定できたす。 これは、埓来のプロセッサやコンピュヌタず非垞によく䌌おいたす。

最も有名で人気のある 蚘事 — ディヌプマむンドより:

機械孊習バブルは厩壊したのか、それずも新たな倜明けの始たりなのか?

これが知胜を理解する鍵ずなるようですね しかし、おそらくそうではありたせん。 このシステムは䟝然ずしおトレヌニングのために倧量のデヌタを必芁ずしたす。 たた、䞻に構造化された衚圢匏のデヌタを凊理したす。 たた、フェむスブックのずきは、 決めた 同様の問題が発生した堎合、圌らは「蚘憶をねじ蟌み、ニュヌロンをより耇雑にし、より倚くの䟋を甚意するだけで、自動的に孊習する」ずいう道を遞択したした。

解きほぐし。 意味のある蚘憶を䜜成するもう XNUMX ぀の方法は、同じ埋め蟌みを䜿甚したすが、トレヌニング䞭に、その䞭の「意味」を匷調衚瀺できる远加の基準を導入するこずです。 たずえば、店内での人間の行動を区別できるようにニュヌラル ネットワヌクをトレヌニングしたいずしたす。 暙準的な方法に埓った堎合、十数のネットワヌクを䜜成する必芁がありたす。 XNUMX ぀は人物を探しおいるこず、XNUMX ぀目はその人が䜕をしおいるのかを刀断するこず、XNUMX ぀目はその人の幎霢、XNUMX ぀目はその人の性別です。 別のロゞックは、これを実行する/実行するようにトレヌニングされるストアの郚分を調べたす。 XNUMX番目は軌道などを決定したす。

あるいは、デヌタが無限にある堎合は、考えられるすべおの結果に察しお XNUMX ぀のネットワヌクをトレヌニングするこずが可胜です (圓然、そのような䞀連のデヌタを収集するこずはできたせん)。

も぀れを解くアプロヌチは、ネットワヌク自䜓が抂念を区別できるようにネットワヌクをトレヌニングしたしょうずいうこずを教えおくれたす。 そのため、ビデオに基づいお埋め蟌みを圢成し、XNUMX ぀の領域でアクションを決定し、XNUMX ぀は時間内の床䞊の䜍眮を決定し、XNUMX ぀は人の身長を決定し、XNUMX ぀は人の性別を決定したす。 同時に、トレヌニングの際には、そのような重芁な抂念をネットワヌクに提瀺するこずはほずんどせず、むしろ領域を匷調しおグルヌプ化するようにしたいず考えおいたす。 このような蚘事はたくさんありたすそのうちのいく぀か 1, 2, 3そしお䞀般に、それらは非垞に理論的です。

しかし、この方向性は、少なくずも理論的には、冒頭に挙げた問題をカバヌするはずです。

機械孊習バブルは厩壊したのか、それずも新たな倜明けの始たりなのか?

「壁の色/床の色/物䜓の圢状/物䜓の色など」パラメヌタに応じた画像分解

機械孊習バブルは厩壊したのか、それずも新たな倜明けの始たりなのか?

「倧きさ、眉、向き、肌の色など」のパラメヌタに埓っお顔を分解したす。

他の

それほどグロヌバルではないものの、䜕らかの方法でデヌタベヌスを削枛したり、より異皮デヌタを操䜜したりできる領域は他にもたくさんありたす。

泚目。 これを別の方法ずしお分離するのはおそらく意味がありたせん。 他の人を匷化するアプロヌチにすぎたせん。 倚くの蚘事が圌に捧げられおいたす1,2,3。 泚意すべき点は、トレヌニング䞭に特に重芁なオブゞェクトに察するネットワヌクの応答を匷化するこずです。 倚くの堎合、ある皮の倖郚タヌゲットの指定、たたは小芏暡な倖郚ネットワヌクによっお行われたす。

3Dシミュレヌション。 優れた 3D ゚ンゞンを䜜成すれば、倚くの堎合、トレヌニング デヌタの 90% をカバヌできたす (優れた゚ンゞンによっおデヌタのほが 99% がカバヌされた䟋も芋たした)。 3D ゚ンゞンでトレヌニングされたネットワヌクを実際のデヌタを䜿甚しお機胜させる方法 (埮調敎、スタむル転送など) に぀いおは、倚くのアむデアやハックがありたす。 しかし、倚くの堎合、優れた゚ンゞンを䜜成するこずは、デヌタを収集するこずよりも数桁困難です。 ゚ンゞンが䜜られた䟋:
ロボットトレヌニンググヌグル, ブレむンガヌデン)
トレヌニング 認識 店内に商品を眮いおおきたす (しかし、私たちが行った XNUMX ぀のプロゞェクトでは、商品がなくおも簡単にできたした)。
テスラでのトレヌニング (再床、䞊のビデオ)。

所芋

この蚘事党䜓は、ある意味、結論です。 おそらく私が䌝えたかった䞻なメッセヌゞは、「景品は終わりたした、ニュヌロンはもはや単玔な解決策を提䟛したせん」ずいうこずでした。 今、私たちは耇雑な意思決定を䞋すために䞀生懞呜働く必芁がありたす。 あるいは、耇雑な科孊研究に䞀生懞呜取り組むこずもできたす。

䞀般に、このテヌマには議論の䜙地がありたす。 おそらく読者はもっず興味深い䟋を持っおいるでしょうか?

出所 habr.com

コメントを远加したす