Rrjeti i ri nervor i Google është dukshëm më i saktë dhe më i shpejtë se analogët e njohur

Rrjetet nervore konvolucionale (CNN), të frymëzuara nga proceset biologjike në korteksin vizual të njeriut, janë të përshtatshme për detyra të tilla si njohja e objekteve dhe e fytyrës, por përmirësimi i saktësisë së tyre kërkon lodhje dhe rregullim të imët. Kjo është arsyeja pse shkencëtarët në Google AI Research po eksplorojnë modele të reja që shkallëzojnë CNN-të në një mënyrë "më të strukturuar". Ata publikuan rezultatet e punës së tyre në artikull “EfficientNet: Rimendimi i shkallëzimit të modelit për rrjetet nervore konvolucionale”, postuar në portalin shkencor Arxiv.org, si dhe në Publikim në blogun tuaj. Bashkautorët pretendojnë se familja e sistemeve të inteligjencës artificiale, e quajtur EfficientNets, tejkalon saktësinë e CNN-ve standarde dhe rrit efikasitetin e një rrjeti nervor deri në 10 herë.

Rrjeti i ri nervor i Google është dukshëm më i saktë dhe më i shpejtë se analogët e njohur

"Praktika e zakonshme e modeleve të shkallëzimit është të rritet në mënyrë arbitrare thellësia ose gjerësia e CNN dhe të përdoret rezolucion më i lartë i imazhit të hyrjes për trajnim dhe vlerësim," shkruajnë inxhinieri i softuerit të stafit Mingxing Tan dhe shkencëtari kryesor i Google AI Quoc V. Le. "Ndryshe nga qasjet tradicionale që shkallëzojnë në mënyrë arbitrare parametrat e rrjetit si gjerësia, thellësia dhe rezolucioni i hyrjes, metoda jonë shkallëzon në mënyrë uniforme çdo dimension me një grup fiks faktorësh shkallëzimi."

Për të përmirësuar më tej performancën, kërkuesit mbrojnë përdorimin e një rrjeti të ri shtyllës kurrizore, përmbysja e bllokimit të përmbysur celular (MBConv), e cila shërben si bazë për familjen e modeleve EfficientNets.

Në teste, EfficientNets ka demonstruar saktësi më të lartë dhe efikasitet më të mirë se CNN-të ekzistuese, duke reduktuar madhësinë e parametrave dhe kërkesat e burimeve llogaritëse me një renditje të madhësisë. Një nga modelet, EfficientNet-B7, demonstroi 8,4 herë madhësi më të vogël dhe 6,1 herë performancë më të mirë se CNN Gpipe i famshëm, dhe gjithashtu arriti saktësi 84,4% dhe 97,1% (Top-1 dhe Top-5). 50 rezultat) në testimin në grupi ImageNet. Krahasuar me CNN-in popullor ResNet-4, një model tjetër EfficientNet, EfficientNet-B82,6, duke përdorur burime të ngjashme, arriti një saktësi prej 76,3% kundrejt 50% për ResNet-XNUMX.

Modelet EfficientNets performuan mirë në grupet e tjera të të dhënave, duke arritur saktësi të lartë në pesë nga tetë standardet, duke përfshirë grupin e të dhënave CIFAR-100 (91,7% saktësi) dhe Lule (98,8%).

Rrjeti i ri nervor i Google është dukshëm më i saktë dhe më i shpejtë se analogët e njohur

"Duke ofruar përmirësime të rëndësishme në efikasitetin e modeleve nervore, ne presim që EfficientNets të ketë potencialin për të shërbyer si një kornizë e re për detyrat e ardhshme të vizionit kompjuterik," shkruajnë Tan dhe Li.

Kodi burimor dhe skriptet e trajnimit për Njësitë e Përpunimit të Tensoreve në renë kompjuterike (TPU) të Google janë të disponueshme falas në Github.



Burimi: 3dnews.ru

Shto një koment