Google'i uus närvivõrk on oluliselt täpsem ja kiirem kui populaarsed analoogid

Inimese visuaalses ajukoores toimuvatest bioloogilistest protsessidest inspireeritud konvolutsioonilised närvivõrgud (CNN-id) sobivad hästi selliste ülesannete jaoks nagu objekti- ja näotuvastus, kuid nende täpsuse parandamine nõuab tüütut ja peenhäälestamist. Sellepärast uurivad Google AI Researchi teadlased uusi mudeleid, mis skaleerivad CNN-e "struktureeritumalt". aastal avaldasid nad oma töö tulemused siit "EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks", postitati teadusportaali Arxiv.org, samuti Avaldamine oma blogis. Kaasautorid väidavad, et tehisintellektisüsteemide perekond nimega EfficientNets ületab standardsete CNN-ide täpsuse ja suurendab närvivõrgu efektiivsust kuni 10 korda.

Google'i uus närvivõrk on oluliselt täpsem ja kiirem kui populaarsed analoogid

"Mudelite skaleerimise tavapärane praktika on CNN-i sügavuse või laiuse meelevaldne suurendamine ning sisendpildi kõrgema eraldusvõime kasutamine koolituseks ja hindamiseks," kirjutavad personali tarkvarainsener Mingxing Tan ja Google AI juhtivteadur Quoc V .Le. "Erinevalt traditsioonilistest lähenemisviisidest, mis suvaliselt skaleerivad võrguparameetreid, nagu laius, sügavus ja sisendi eraldusvõime, skaleerib meie meetod iga mõõtme ühtlaselt fikseeritud skaleerimistegurite komplektiga."

Jõudluse edasiseks parandamiseks soovitavad teadlased kasutada uut magistraalvõrku, mobiili ümberpööratud pudelikaela konvolutsiooni (MBConv), mis on EfficientNetsi mudelipere aluseks.

Testides on EfficientNets näidanud nii suuremat täpsust kui ka paremat efektiivsust kui olemasolevad CNN-id, vähendades parameetrite suurust ja arvutusressursside nõudeid suurusjärgu võrra. Üks mudelitest, EfficientNet-B7, näitas 8,4 korda väiksemat suurust ja 6,1 korda paremat jõudlust kui kuulus CNN Gpipe ning saavutas ka 84,4% ja 97,1% täpsuse (Top-1 ja Top-5). 50 tulemust) testimisel ImageNeti komplekti. Võrreldes populaarse CNN ResNet-4-ga saavutas teine ​​sarnaseid ressursse kasutav EfficientNeti mudel EfficientNet-B82,6 76,3% täpsuse ja ResNet-50 XNUMX%.

EfficientNetsi mudelid toimisid hästi teiste andmekogumite puhul, saavutades suure täpsuse kaheksast viiest võrdlusalusest, sealhulgas andmestik CIFAR-100 (91,7% täpsus) ja Flowers (98,8%).

Google'i uus närvivõrk on oluliselt täpsem ja kiirem kui populaarsed analoogid

"Närvimudelite tõhususe olulise parandamise kaudu eeldame, et EfficientNetsil on potentsiaali olla tulevaste arvutinägemisülesannete jaoks uus raamistik," kirjutavad Tan ja Li.

Google'i pilvtensori töötlemisüksuste (TPU) lähtekood ja koolitusskriptid on vabalt saadaval aadressil Github.



Allikas: 3dnews.ru

Lisa kommentaar