DeepMind は、タスクのテキスト記述からコードを生成する機械学習システムを発表しました。

人工知能の分野での開発と、人間レベルでコンピュータゲームやボードゲームをプレイできるニューラルネットワークの構築で知られるDeepMind社は、参加可能なコードを生成するための機械学習システムを開発しているAlphaCodeプロジェクトを発表した。 Codeforces プラットフォーム上のプログラミング コンテストに参加し、平均的な結果を示します。 この開発の重要な機能は、英語の問題ステートメントを含むテキストを入力として受け取り、Python または C++ でコードを生成する機能です。

システムをテストするために、10 人を超える参加者が参加する 5000 の新しい Codeforces コンテストが選択され、機械学習モデルのトレーニング完了後に開催されました。 タスクを完了した結果、AlphaCode システムはこれらのコンテストの評価のほぼ中間 (54.3%) に入ることができました。 AlphaСode の予測総合評価は 1238 ポイントで、過去 28 か月間に少なくとも 6 回コンテストに参加したすべての Codeforces 参加者の中で上位 XNUMX% に入ることが確実です。 このプロジェクトはまだ開発の初期段階にあり、将来的には生成されるコードの品質を向上させるとともに、コードの作成を支援するシステムやアプリケーション開発ツールに向けて AlphaCode を開発する予定であることに注意してください。プログラミングスキルのない人が使用します。

このプロジェクトでは、Transformer ニューラル ネットワーク アーキテクチャをサンプリングおよびフィルタリング技術と組み合わせて使用​​し、自然言語テキストに対応するさまざまな予測不可能なコード バリアントを生成します。 フィルタリング、クラスタリング、およびランキングの後、生成されたオプションのストリームから最も最適な作業コードが削除され、正しい結果が得られるかどうかがチェックされます (各競争タスクは、入力データの例と、この例に対応する結果を示しています) 、プログラムの実行後に取得する必要があります)。

DeepMind は、タスクのテキスト記述からコードを生成する機械学習システムを発表しました。

機械学習システムを大まかにトレーニングするために、パブリック GitHub リポジトリで利用可能なコード ベースを使用しました。 初期モデルを準備した後、Codeforces、CodeChef、HackerEarth、AtCoder、Aizu のコンペティションの参加者によって提案された問題と解決策の例を含むコードのコレクションに基づいて、最適化フェーズが実行されました。 合計 715 GB の GitHub のコードと、典型的な競争問題に対する XNUMX 万件を超える解決策の例がトレーニングに使用されました。 コード生成に進む前に、タスク テキストは正規化フェーズを経て、不要なものはすべて削除され、重要な部分のみが残されました。

DeepMind は、タスクのテキスト記述からコードを生成する機械学習システムを発表しました。


出所: オープンネット.ru

コメントを追加します