Nová neuronová síť Google je mnohem přesnější a rychlejší než populární protějšky

Konvoluční neuronové sítě (CNN), inspirované biologickými procesy v lidské zrakové kůře, se dobře hodí pro úkoly, jako je rozpoznávání objektů a obličejů, ale zlepšení jejich přesnosti vyžaduje zdlouhavé a jemné ladění. Vědci z Google AI Research proto zkoumají nové modely, které „škálují“ CNN „strukturovanějším“ způsobem. Výsledek své práce zveřejnili v článek „EfficientNet: Rethinking Model Scaling for Convolutional Neuron Networks“, hostovaný vědeckým portálem Arxiv.org, stejně jako v Uveřejnění na svém blogu. Spoluautoři tvrdí, že rodina systémů umělé inteligence, nazvaná EfficientNets, překračuje přesnost standardních CNN a zvyšuje efektivitu neuronové sítě až 10krát.

Nová neuronová síť Google je mnohem přesnější a rychlejší než populární protějšky

„Běžnou praxí pro škálování modelů je libovolně zvětšovat hloubku nebo šířku CNN a také používat vyšší rozlišení vstupního obrazu pro školení a hodnocení,“ píší interní softwarový inženýr Mingxing Tan a vedoucí vědecký pracovník společnosti Google AI. Quoc Li (Quoc V.le). "Na rozdíl od tradičních přístupů, které libovolně škálují síťové parametry, jako je šířka, hloubka a vstupní rozlišení, naše metoda jednotně měřítko každého rozměru s pevnou sadou škálovacích faktorů."

Pro další zlepšení výkonu vědci obhajují použití nové základní sítě, mobilní invertované konvoluce úzkých hrdel (MBConv), která slouží jako základ pro rodinu modelů EfficientNets.

V testech EfficientNets prokázal jak vyšší přesnost, tak lepší účinnost než stávající CNN, čímž se řádově snížil požadavek na velikost parametrů a výpočetní zdroje. Jeden z modelů, EfficientNet-B7, prokázal 8,4krát menší velikost a 6,1krát lepší výkon než známý CNN Gpipe a také dosáhl přesnosti 84,4 % a 97,1 % (výsledek Top-1 a Top-5) při testování na Sada ImageNet. Ve srovnání s populárním CNN ResNet-50 vykázal jiný model EfficientNet, EfficientNet-B4, využívající podobné zdroje, přesnost 82,6 % oproti 76,3 % pro ResNet-50.

Modely EfficientNets fungovaly dobře na jiných souborech dat a dosáhly vysoké přesnosti v pěti z osmi testů, včetně CIFAR-100 (přesnost 91,7 %) a Květiny (98,8%).

Nová neuronová síť Google je mnohem přesnější a rychlejší než populární protějšky

„Očekáváme, že díky výraznému zlepšení výkonu neurálních modelů bude EfficientNets potenciálně sloužit jako nový základ pro budoucí výzvy v oblasti počítačového vidění,“ píší Tan a Li.

Zdrojový kód a výukové skripty pro jednotky Google Cloud Tensor Processing Units (TPU) jsou volně dostupné na adrese GitHub.



Zdroj: 3dnews.ru

Přidat komentář