Jaringan saraf anyar Google sacara signifikan langkung akurat sareng langkung gancang tibatan analog populér

Convolutional neural networks (CNNs), diideuan ku prosés biologis dina korteks visual manusa, cocog pisan pikeun tugas-tugas sapertos pangakuan obyék sareng raray, tapi ningkatkeun katepatanana peryogi nyéépkeun sareng nyaluyukeun. Éta sababna élmuwan di Google AI Research ngajalajah modél anyar anu skala CNN dina cara "leuwih terstruktur". Aranjeunna diterbitkeun hasil karya maranéhanana di artikel "EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks," dipasang dina portal ilmiah Arxiv.org, kitu ogé dina publikasi dina blog anjeun. Ko-panulis ngaku yén kulawarga sistem intelijen buatan, anu disebut EfficientNets, ngaleuwihan katepatan standar CNN sareng ningkatkeun efisiensi jaringan saraf dugi ka 10 kali.

Jaringan saraf anyar Google sacara signifikan langkung akurat sareng langkung gancang tibatan analog populér

"Praktik umum model skala nyaeta wenang nambahan jero atawa rubak CNN, sarta ngagunakeun resolusi luhur gambar input pikeun latihan jeung evaluasi," nulis staf insinyur software Mingxing Tan jeung Google AI kalungguhan élmuwan Quoc V .Le). "Teu kawas pendekatan tradisional nu wenang skala parameter jaringan kayaning rubak, jero, jeung resolusi input, metoda urang seragam skala unggal diménsi kalawan set tetep faktor skala."

Pikeun ningkatkeun kinerja, panalungtik ngajengkeun ngagunakeun jaringan tulang tonggong anyar, mobile inverted bottleneck convolution (MBConv), nu jadi dadasar pikeun kulawarga EfficientNets model.

Dina tés, EfficientNets parantos nunjukkeun katepatan anu langkung luhur sareng efisiensi anu langkung saé tibatan CNN anu tos aya, ngirangan ukuran parameter sareng syarat sumberdaya komputasi ku urutan gedéna. Salah sahiji modél, EfficientNet-B7, nunjukkeun 8,4 kali ukuran anu langkung alit sareng 6,1 kali kinerja anu langkung saé tibatan CNN Gpipe anu kasohor, sareng ogé ngahontal akurasi 84,4% sareng 97,1% (Top-1 sareng Top-5). 50 hasilna) dina uji coba. susunan ImageNet. Dibandingkeun jeung populér CNN ResNet-4, model EfficientNet sejen, EfficientNet-B82,6, ngagunakeun sumberdaya sarupa, ngahontal akurasi 76,3% versus 50% pikeun ResNet-XNUMX.

Modél EfficientNets ngalaksanakeun saé dina set data sanés, ngahontal akurasi anu luhur dina lima tina dalapan tolok ukur, kalebet set data CIFAR-100 (akurasi 91,7%) sareng kembang (98,8%).

Jaringan saraf anyar Google sacara signifikan langkung akurat sareng langkung gancang tibatan analog populér

"Ku nyadiakeun perbaikan signifikan dina efisiensi model neural, urang ngaharepkeun yén EfficientNets boga potensi pikeun ngawula ka salaku kerangka anyar pikeun tugas visi komputer hareup," Tan jeung Li nulis.

Kode sumber sareng skrip pelatihan pikeun Unit Pangolahan Tensor awan Google (TPU) sayogi sayogi Github.



sumber: 3dnews.ru

Tambahkeun komentar