Googleova nova neuronska mreža znatno je točnija i brža od popularnih analoga

Konvolucijske neuronske mreže (CNN), inspirirane biološkim procesima u ljudskom vizualnom korteksu, dobro su prilagođene za zadatke kao što je prepoznavanje objekata i lica, ali poboljšanje njihove točnosti zahtijeva zamorno i fino podešavanje. Zato znanstvenici iz Google AI Research istražuju nove modele koji skaliraju CNN-ove na "strukturiraniji" način. Rezultate svog rada objavili su u članak “EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks”, objavljeno na znanstvenom portalu Arxiv.org, kao i u Publikacija na svom blogu. Koautori tvrde da obitelj sustava umjetne inteligencije, nazvana EfficientNets, premašuje točnost standardnih CNN-ova i povećava učinkovitost neuronske mreže do 10 puta.

Googleova nova neuronska mreža znatno je točnija i brža od popularnih analoga

"Uobičajena praksa skaliranja modela je proizvoljno povećanje dubine ili širine CNN-a i korištenje veće razlučivosti ulazne slike za obuku i procjenu", pišu programski inženjer Mingxing Tan i Googleov vodeći znanstvenik Quoc V.Le). "Za razliku od tradicionalnih pristupa koji proizvoljno skaliraju mrežne parametre kao što su širina, dubina i ulazna razlučivost, naša metoda uniformno skalira svaku dimenziju s fiksnim skupom faktora skaliranja."

Za daljnje poboljšanje performansi, istraživači zagovaraju korištenje nove okosnice mreže, mobile inverted bottleneck convolution (MBConv), koja služi kao osnova za EfficientNets obitelj modela.

U testovima, EfficientNets je pokazao i veću točnost i bolju učinkovitost od postojećih CNN-ova, smanjujući veličinu parametara i zahtjeve za računalnim resursima za red veličine. Jedan od modela, EfficientNet-B7, pokazao je 8,4 puta manju veličinu i 6,1 puta bolje performanse od poznatog CNN Gpipea, a također je postigao 84,4% i 97,1% točnosti (Top-1 i Top-5). 50 rezultat) u testiranju na skup ImageNet. U usporedbi s popularnim CNN ResNet-4, drugi EfficientNet model, EfficientNet-B82,6, koristeći slične resurse, postigao je točnost od 76,3% naspram 50% za ResNet-XNUMX.

Modeli EfficientNets pokazali su se dobro na drugim skupovima podataka, postigavši ​​visoku točnost na pet od osam referentnih vrijednosti, uključujući skup podataka CIFAR-100 (91,7% točnosti) i Cvijeće (98,8%).

Googleova nova neuronska mreža znatno je točnija i brža od popularnih analoga

"Pružanjem značajnih poboljšanja u učinkovitosti neuralnih modela, očekujemo da EfficientNets ima potencijal poslužiti kao novi okvir za buduće zadatke računalnog vida", pišu Tan i Li.

Izvorni kod i skripte za obuku za Googleove jedinice za obradu tenzora (TPU) u oblaku besplatno su dostupne na Github.



Izvor: 3dnews.ru

Dodajte komentar