Jaringan saraf baru Google jauh lebih akurat dan lebih cepat dibandingkan jaringan saraf populer lainnya

Jaringan saraf konvolusional (CNN), yang terinspirasi oleh proses biologis di korteks visual manusia, sangat cocok untuk tugas-tugas seperti pengenalan objek dan wajah, tetapi meningkatkan akurasinya memerlukan proses yang membosankan dan penyesuaian yang baik. Itu sebabnya para ilmuwan di Google AI Research sedang mengeksplorasi model-model baru yang menskalakan CNN dengan cara yang "lebih terstruktur". Mereka mempublikasikan hasil karyanya di Artikel “EfficientNet: Memikirkan Kembali Penskalaan Model untuk Jaringan Neural Konvolusional,” diposting di portal ilmiah Arxiv.org, serta di Publikasi di blog Anda. Rekan penulis mengklaim bahwa rangkaian sistem kecerdasan buatan, yang disebut EfficientNets, melebihi akurasi CNN standar dan meningkatkan efisiensi jaringan saraf hingga 10 kali lipat.

Jaringan saraf baru Google jauh lebih akurat dan lebih cepat dibandingkan jaringan saraf populer lainnya

“Praktik umum dalam penskalaan model adalah dengan meningkatkan kedalaman atau lebar CNN secara sewenang-wenang, dan menggunakan resolusi gambar masukan yang lebih tinggi untuk pelatihan dan evaluasi,” tulis staf insinyur perangkat lunak Mingxing Tan dan ilmuwan utama AI Google Quoc V .Le). “Tidak seperti pendekatan tradisional yang secara sewenang-wenang menskalakan parameter jaringan seperti lebar, kedalaman, dan resolusi masukan, metode kami menskalakan setiap dimensi secara seragam dengan serangkaian faktor penskalaan yang tetap.”

Untuk lebih meningkatkan kinerja, para peneliti menganjurkan penggunaan jaringan tulang punggung baru, konvolusi kemacetan terbalik seluler (MBConv), yang berfungsi sebagai dasar untuk rangkaian model EfficientNets.

Dalam pengujian, EfficientNets telah menunjukkan akurasi yang lebih tinggi dan efisiensi yang lebih baik dibandingkan CNN yang ada, sehingga mengurangi ukuran parameter dan kebutuhan sumber daya komputasi hingga beberapa kali lipat. Salah satu modelnya, EfficientNet-B7, menunjukkan ukuran 8,4 kali lebih kecil dan kinerja 6,1 kali lebih baik dibandingkan CNN Gpipe yang terkenal, dan juga mencapai akurasi 84,4% dan 97,1% (hasil Top-1 dan Top-5).50) dalam pengujian pada kumpulan ImageNet. Dibandingkan dengan CNN ResNet-4 yang populer, model EfficientNet lainnya, EfficientNet-B82,6, yang menggunakan sumber daya serupa, mencapai akurasi 76,3% dibandingkan 50% untuk ResNet-XNUMX.

Model EfficientNets berkinerja baik pada kumpulan data lain, mencapai akurasi tinggi pada lima dari delapan tolok ukur, termasuk kumpulan data CIFAR-100 (akurasi 91,7%) dan Bunga-bunga (98,8%).

Jaringan saraf baru Google jauh lebih akurat dan lebih cepat dibandingkan jaringan saraf populer lainnya

“Dengan memberikan peningkatan yang signifikan dalam efisiensi model saraf, kami berharap EfficientNets berpotensi berfungsi sebagai kerangka kerja baru untuk tugas-tugas visi komputer di masa depan,” tulis Tan dan Li.

Kode sumber dan skrip pelatihan untuk Unit Pemrosesan Tensor (TPU) cloud Google tersedia secara gratis di Github.



Sumber: 3dnews.ru

Tambah komentar