Inimese visuaalses ajukoores toimuvatest bioloogilistest protsessidest inspireeritud konvolutsioonilised närvivõrgud (CNN-id) sobivad hästi selliste ülesannete jaoks nagu objekti- ja näotuvastus, kuid nende täpsuse parandamine nõuab tüütut ja peenhäälestamist. Sellepärast uurivad Google AI Researchi teadlased uusi mudeleid, mis skaleerivad CNN-e "struktureeritumalt". aastal avaldasid nad oma töö tulemused
"Mudelite skaleerimise tavapärane praktika on CNN-i sügavuse või laiuse meelevaldne suurendamine ning sisendpildi kõrgema eraldusvõime kasutamine koolituseks ja hindamiseks," kirjutavad personali tarkvarainsener Mingxing Tan ja Google AI juhtivteadur Quoc V .Le. "Erinevalt traditsioonilistest lähenemisviisidest, mis suvaliselt skaleerivad võrguparameetreid, nagu laius, sügavus ja sisendi eraldusvõime, skaleerib meie meetod iga mõõtme ühtlaselt fikseeritud skaleerimistegurite komplektiga."
Jõudluse edasiseks parandamiseks soovitavad teadlased kasutada uut magistraalvõrku, mobiili ümberpööratud pudelikaela konvolutsiooni (MBConv), mis on EfficientNetsi mudelipere aluseks.
Testides on EfficientNets näidanud nii suuremat täpsust kui ka paremat efektiivsust kui olemasolevad CNN-id, vähendades parameetrite suurust ja arvutusressursside nõudeid suurusjärgu võrra. Üks mudelitest, EfficientNet-B7, näitas 8,4 korda väiksemat suurust ja 6,1 korda paremat jõudlust kui kuulus CNN Gpipe ning saavutas ka 84,4% ja 97,1% täpsuse (Top-1 ja Top-5). 50 tulemust) testimisel ImageNeti komplekti. Võrreldes populaarse CNN ResNet-4-ga saavutas teine sarnaseid ressursse kasutav EfficientNeti mudel EfficientNet-B82,6 76,3% täpsuse ja ResNet-50 XNUMX%.
EfficientNetsi mudelid toimisid hästi teiste andmekogumite puhul, saavutades suure täpsuse kaheksast viiest võrdlusalusest, sealhulgas andmestik CIFAR-100 (91,7% täpsus) ja
"Närvimudelite tõhususe olulise parandamise kaudu eeldame, et EfficientNetsil on potentsiaali olla tulevaste arvutinägemisülesannete jaoks uus raamistik," kirjutavad Tan ja Li.
Google'i pilvtensori töötlemisüksuste (TPU) lähtekood ja koolitusskriptid on vabalt saadaval aadressil
Allikas: 3dnews.ru