Konvolucijske neuronske mreže (CNN), inspirirane biološkim procesima u ljudskom vizualnom korteksu, dobro su prilagođene za zadatke kao što je prepoznavanje objekata i lica, ali poboljšanje njihove točnosti zahtijeva zamorno i fino podešavanje. Zato znanstvenici iz Google AI Research istražuju nove modele koji skaliraju CNN-ove na "strukturiraniji" način. Rezultate svog rada objavili su u
"Uobičajena praksa skaliranja modela je proizvoljno povećanje dubine ili širine CNN-a i korištenje veće razlučivosti ulazne slike za obuku i procjenu", pišu programski inženjer Mingxing Tan i Googleov vodeći znanstvenik Quoc V.Le). "Za razliku od tradicionalnih pristupa koji proizvoljno skaliraju mrežne parametre kao što su širina, dubina i ulazna razlučivost, naša metoda uniformno skalira svaku dimenziju s fiksnim skupom faktora skaliranja."
Za daljnje poboljšanje performansi, istraživači zagovaraju korištenje nove okosnice mreže, mobile inverted bottleneck convolution (MBConv), koja služi kao osnova za EfficientNets obitelj modela.
U testovima, EfficientNets je pokazao i veću točnost i bolju učinkovitost od postojećih CNN-ova, smanjujući veličinu parametara i zahtjeve za računalnim resursima za red veličine. Jedan od modela, EfficientNet-B7, pokazao je 8,4 puta manju veličinu i 6,1 puta bolje performanse od poznatog CNN Gpipea, a također je postigao 84,4% i 97,1% točnosti (Top-1 i Top-5). 50 rezultat) u testiranju na skup ImageNet. U usporedbi s popularnim CNN ResNet-4, drugi EfficientNet model, EfficientNet-B82,6, koristeći slične resurse, postigao je točnost od 76,3% naspram 50% za ResNet-XNUMX.
Modeli EfficientNets pokazali su se dobro na drugim skupovima podataka, postigavši visoku točnost na pet od osam referentnih vrijednosti, uključujući skup podataka CIFAR-100 (91,7% točnosti) i
"Pružanjem značajnih poboljšanja u učinkovitosti neuralnih modela, očekujemo da EfficientNets ima potencijal poslužiti kao novi okvir za buduće zadatke računalnog vida", pišu Tan i Li.
Izvorni kod i skripte za obuku za Googleove jedinice za obradu tenzora (TPU) u oblaku besplatno su dostupne na
Izvor: 3dnews.ru