Naujasis „Google“ neuroninis tinklas yra žymiai tikslesnis ir greitesnis nei populiarūs analogai

Konvoliuciniai neuroniniai tinklai (CNN), įkvėpti žmogaus regėjimo žievėje vykstančių biologinių procesų, puikiai tinka tokioms užduotims kaip objektų ir veido atpažinimas, tačiau norint pagerinti jų tikslumą, reikia varginančio ir tikslaus derinimo. Štai kodėl „Google AI Research“ mokslininkai tiria naujus modelius, kurie padidina CNN mastelį „labiau struktūrizuotu“ būdu. Savo darbo rezultatus jie paskelbė m straipsnis „EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks“, paskelbta moksliniame portale Arxiv.org, taip pat Leidinys savo tinklaraštyje. Bendraautoriai teigia, kad dirbtinio intelekto sistemų šeima, vadinama EfficientNets, viršija standartinių CNN tikslumą ir net 10 kartų padidina neuronų tinklo efektyvumą.

Naujasis „Google“ neuroninis tinklas yra žymiai tikslesnis ir greitesnis nei populiarūs analogai

„Įprasta modelių mastelio keitimo praktika yra savavališkai padidinti CNN gylį arba plotį ir naudoti didesnę įvesties vaizdo skiriamąją gebą mokymui ir vertinimui“, – rašo personalo programinės įrangos inžinierius Mingxingas Tanas ir „Google AI“ pagrindinis mokslininkas Quoc V .Le). "Skirtingai nuo tradicinių metodų, kurie savavališkai keičia tinklo parametrus, pvz., plotį, gylį ir įvesties skiriamąją gebą, mūsų metodas vienodai padidina kiekvieną matmenį su fiksuotu mastelio koeficientų rinkiniu."

Siekdami dar labiau pagerinti našumą, mokslininkai pasisako už naujo pagrindinio tinklo, mobiliojo apverstos butelio kaklo konvoliucijos (MBConv), naudojimą, kuris yra EfficientNets modelių šeimos pagrindas.

Atliekant bandymus, „EfficientNets“ parodė didesnį tikslumą ir geresnį efektyvumą nei esami CNN, sumažindami parametrų dydį ir skaičiavimo išteklių poreikį. Vienas iš modelių, EfficientNet-B7, parodė 8,4 karto mažesnį dydį ir 6,1 karto geresnį našumą nei garsusis CNN Gpipe, taip pat pasiekė 84,4% ir 97,1% tikslumą (Top-1 ir Top-5). 50 rezultatai) „ImageNet“ rinkinys. Palyginti su populiariu CNN ResNet-4, kitas EfficientNet modelis, EfficientNet-B82,6, naudojant panašius išteklius, pasiekė 76,3 % tikslumą, palyginti su 50 % ResNet-XNUMX.

„EfficientNets“ modeliai gerai veikė kitus duomenų rinkinius ir pasiekė aukštą tikslumą penkiuose iš aštuonių etalonų, įskaitant CIFAR-100 duomenų rinkinį (91,7 % tikslumas) ir gėlės (98,8%).

Naujasis „Google“ neuroninis tinklas yra žymiai tikslesnis ir greitesnis nei populiarūs analogai

„Mes tikimės, kad, patobulindami neuronų modelių efektyvumą, „EfficientNets“ gali tapti nauja būsimų kompiuterinio matymo užduočių sistema“, – rašo Tanas ir Li.

„Google“ debesies tensorinio apdorojimo vienetų (TPU) šaltinio kodas ir mokymo scenarijai yra laisvai prieinami GitHub.



Šaltinis: 3dnews.ru

Добавить комментарий