Google の新しいニューラル ネットワークは、一般的な類似物よりもはるかに正確で高速です

人間の視覚野の生物学的プロセスにヒントを得た畳み込みニューラル ネットワーク (CNN) は、物体や顔の認識などのタスクに適していますが、精度を向上させるには面倒な微調整が必​​要です。 そのため、Google AI Research の科学者たちは、「より構造化された」方法で CNN を拡張する新しいモデルを研究しています。 彼らは自分たちの研究結果を次のように発表しました。 статье 「EfficientNet: 畳み込みニューラル ネットワークのモデル スケーリングの再考」、科学ポータル Arxiv.org および 出版物 あなたのブログで。 共著者らは、EfficientNetsと呼ばれる人工知能システムファミリーは標準的なCNNの精度を上回り、ニューラルネットワークの効率を最大10倍向上させると主張している。

Google の新しいニューラル ネットワークは、一般的な類似物よりもはるかに正確で高速です

「モデルをスケーリングする一般的な方法は、CNN の深さまたは幅を任意に増やし、トレーニングと評価に入力画像の高解像度を使用することです」とスタッフのソフトウェア エンジニアである Mingxing Tan と Google AI のリード サイエンティストである Quoc V .Le は書いています。 「幅、深さ、入力解像度などのネットワークパラメータを任意にスケーリングする従来のアプローチとは異なり、私たちの方法では、固定されたスケーリング係数のセットで各次元を均一にスケーリングします。」

パフォーマンスをさらに向上させるために、研究者らは、EfficientNets ファミリのモデルの基礎として機能する、新しいバックボーン ネットワークであるモバイル逆ボトルネック畳み込み (MBConv) を使用することを提唱しています。

テストでは、EfficientNets は既存の CNN よりも高い精度と効率の両方を実証し、パラメーター サイズと計算リソース要件を 7 桁削減しました。 モデルの 8,4 つである EfficientNet-B6,1 は、有名な CNN Gpipe よりもサイズが 84,4 倍小さく、パフォーマンスが 97,1 倍優れていることを実証し、また、1% および 5% の精度 (トップ 50 およびトップ 4) を達成しました。82,6 の結果) ImageNet セット。 人気の CNN ResNet-76,3 と比較すると、同様のリソースを使用する別の EfficientNet モデルである EfficientNet-B50 は、ResNet-XNUMX の XNUMX% に対して XNUMX% の精度を達成しました。

EfficientNets モデルは他のデータセットでも良好なパフォーマンスを示し、CIFAR-100 データセット (91,7% の精度) や XNUMX つのベンチマークのうち XNUMX つで高い精度を達成しました。 (98,8%)

Google の新しいニューラル ネットワークは、一般的な類似物よりもはるかに正確で高速です

「ニューラル モデルの効率を大幅に改善することで、EfficientNets が将来のコンピューター ビジョン タスクの新しいフレームワークとして機能する可能性があると期待しています」と Tan 氏と Li 氏は書いています。

Google のクラウド Tensor Processing Unit (TPU) のソース コードとトレーニング スクリプトは、以下から無料で入手できます。 githubの.



出所: 3dnews.ru

コメントを追加します