Google'ın yeni sinir ağı, popüler analoglardan önemli ölçüde daha doğru ve daha hızlıdır

İnsanın görsel korteksindeki biyolojik süreçlerden ilham alan evrişimli sinir ağları (CNN'ler), nesne ve yüz tanıma gibi görevlere çok uygundur, ancak bunların doğruluğunu artırmak sıkıcı ve ince ayar gerektirir. Bu nedenle Google AI Research'teki bilim insanları, CNN'leri "daha yapılandırılmış" bir şekilde ölçeklendiren yeni modeller araştırıyor. Çalışmalarının sonuçlarını yayınladılar Makale "EfficientNet: Evrişimli Sinir Ağları için Model Ölçeklendirmeyi Yeniden Düşünmek" bilimsel portal Arxiv.org'da ve ayrıca Yayın blogunda. Ortak yazarlar, EfficientNets adı verilen yapay zeka sistemleri ailesinin standart CNN'lerin doğruluğunu aştığını ve bir sinir ağının verimliliğini 10 kata kadar artırdığını iddia ediyor.

Google'ın yeni sinir ağı, popüler analoglardan önemli ölçüde daha doğru ve daha hızlıdır

Personel yazılım mühendisi Mingxing Tan ve Google AI baş bilim adamı Quoc V .Le, "Modelleri ölçeklendirmenin yaygın uygulaması, CNN'nin derinliğini veya genişliğini keyfi olarak artırmak ve eğitim ve değerlendirme için giriş görüntüsünün daha yüksek çözünürlüğünü kullanmaktır" diye yazıyor. "Genişlik, derinlik ve giriş çözünürlüğü gibi ağ parametrelerini keyfi olarak ölçeklendiren geleneksel yaklaşımların aksine, yöntemimiz her boyutu sabit bir ölçeklendirme faktörleri kümesiyle eşit şekilde ölçeklendiriyor."

Performansı daha da artırmak için araştırmacılar, EfficientNets model ailesinin temelini oluşturan yeni bir omurga ağı olan mobil ters darboğaz evrişiminin (MBConv) kullanılmasını savunuyor.

Testlerde EfficientNets, mevcut CNN'lerden hem daha yüksek doğruluk hem de daha iyi verimlilik göstererek parametre boyutunu ve hesaplama kaynağı gereksinimlerini büyüklük sırasına göre azalttı. Modellerden biri olan EfficientNet-B7, ünlü CNN Gpipe'a göre 8,4 kat daha küçük boyut ve 6,1 kat daha iyi performans sergilemiş ve ayrıca yapılan testlerde %84,4 ve %97,1 doğruluk (İlk-1 ve İlk-5 sonuç) elde etmiştir. ImageNet seti. Popüler CNN ResNet-50 ile karşılaştırıldığında, benzer kaynakları kullanan başka bir EfficientNet modeli olan EfficientNet-B4, ResNet-82,6 için %76,3'e karşılık %50'lık bir doğruluk elde etti.

EfficientNets modelleri diğer veri kümelerinde iyi performans göstererek, CIFAR-100 veri kümesi (%91,7 doğruluk) ve Çiçekler (98,8%).

Google'ın yeni sinir ağı, popüler analoglardan önemli ölçüde daha doğru ve daha hızlıdır

Tan ve Li şöyle yazıyor: "Sinir modellerinin verimliliğinde önemli iyileştirmeler sağlayarak EfficientNets'in gelecekteki bilgisayarlı görme görevleri için yeni bir çerçeve olarak hizmet etme potansiyeline sahip olmasını bekliyoruz."

Google'ın bulut Tensör İşleme Birimleri (TPU'lar) için kaynak kodu ve eğitim komut dosyaları şu adreste ücretsiz olarak mevcuttur: Github.



Kaynak: 3dnews.ru

Yorum ekle