Googlova nova nevronska mreža je bistveno natančnejša in hitrejša od priljubljenih analogov

Konvolucijske nevronske mreže (CNN), ki jih navdihujejo biološki procesi v človeški vidni skorji, so zelo primerne za naloge, kot je prepoznavanje predmetov in obrazov, vendar je za izboljšanje njihove natančnosti potrebno dolgočasno in natančno prilagajanje. Zato znanstveniki pri Google AI Research raziskujejo nove modele, ki spreminjajo CNN na "bolj strukturiran" način. Rezultate svojega dela so objavili v članek “EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks,” objavljeno na znanstvenem portalu Arxiv.org, kot tudi v publikacije na svojem blogu. Soavtorja trdita, da družina sistemov umetne inteligence, imenovana EfficientNets, presega natančnost standardnih CNN-jev in poveča učinkovitost nevronske mreže do 10-krat.

Googlova nova nevronska mreža je bistveno natančnejša in hitrejša od priljubljenih analogov

»Običajna praksa skaliranja modelov je poljubno povečanje globine ali širine CNN in uporaba višje ločljivosti vhodne slike za usposabljanje in ocenjevanje,« sta zapisala osebni inženir programske opreme Mingxing Tan in vodilni znanstvenik Googlovega AI Quoc V.Le). "V nasprotju s tradicionalnimi pristopi, ki poljubno spreminjajo omrežne parametre, kot so širina, globina in vhodna ločljivost, naša metoda enakomerno spreminja vsako dimenzijo s fiksnim nizom faktorjev skaliranja."

Za nadaljnje izboljšanje učinkovitosti raziskovalci zagovarjajo uporabo novega hrbteničnega omrežja, mobilne obrnjene konvolucije ozkih grl (MBConv), ki služi kot osnova za družino modelov EfficientNets.

V testih je EfficientNets dokazal višjo natančnost in boljšo učinkovitost kot obstoječi CNN, pri čemer je zmanjšal velikost parametrov in zahteve po računskih virih za red velikosti. Eden od modelov, EfficientNet-B7, je pokazal 8,4-krat manjšo velikost in 6,1-krat boljšo zmogljivost od slavnega CNN Gpipe ter dosegel tudi 84,4 % in 97,1 % natančnost (Top-1 in Top-5). 50 rezultat) pri testiranju na komplet ImageNet. V primerjavi s priljubljenim CNN ResNet-4 je drugi model EfficientNet, EfficientNet-B82,6, z uporabo podobnih virov dosegel natančnost 76,3 % v primerjavi s 50 % za ResNet-XNUMX.

Modeli EfficientNets so se dobro obnesli pri drugih naborih podatkov in dosegli visoko natančnost pri petih od osmih meril uspešnosti, vključno z naborom podatkov CIFAR-100 (91,7-odstotna natančnost) in Cvetje (98,8%).

Googlova nova nevronska mreža je bistveno natančnejša in hitrejša od priljubljenih analogov

"Z zagotavljanjem znatnih izboljšav v učinkovitosti nevronskih modelov pričakujemo, da ima EfficientNets potencial, da služi kot nov okvir za prihodnje naloge računalniškega vida," pišeta Tan in Li.

Izvorna koda in skripti za usposabljanje za Googlove enote za obdelavo tenzorjev v oblaku (TPU) so prosto dostopni na GitHub.



Vir: 3dnews.ru

Dodaj komentar