Het nieuwe neurale netwerk van Google is aanzienlijk nauwkeuriger en sneller dan populaire analogen

Convolutionele neurale netwerken (CNN's), geïnspireerd door biologische processen in de menselijke visuele cortex, zijn zeer geschikt voor taken zoals object- en gezichtsherkenning, maar het verbeteren van hun nauwkeurigheid vereist vervelend en nauwkeurig afstemmen. Dat is de reden waarom wetenschappers van Google AI Research nieuwe modellen onderzoeken die CNN's op een "meer gestructureerde" manier schalen. Ze publiceerden de resultaten van hun werk in статье “EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks”, gepost op het wetenschappelijke portaal Arxiv.org, evenals in Uitgave op je blog. De co-auteurs beweren dat de familie van kunstmatige-intelligentiesystemen, genaamd EfficientNets, de nauwkeurigheid van standaard CNN's overtreft en de efficiëntie van een neuraal netwerk tot wel tien keer verhoogt.

Het nieuwe neurale netwerk van Google is aanzienlijk nauwkeuriger en sneller dan populaire analogen

“De gebruikelijke praktijk bij het schalen van modellen is om willekeurig de diepte of breedte van de CNN te vergroten en een hogere resolutie van het invoerbeeld te gebruiken voor training en evaluatie”, schrijven stafsoftware-ingenieur Mingxing Tan en Google AI-hoofdwetenschapper Quoc V.Le). “In tegenstelling tot traditionele benaderingen waarbij netwerkparameters zoals breedte, diepte en invoerresolutie willekeurig worden geschaald, schaalt onze methode elke dimensie uniform met een vaste set schaalfactoren.”

Om de prestaties verder te verbeteren, pleiten de onderzoekers voor het gebruik van een nieuw backbone-netwerk, mobile inverted bottleneck convolution (MBConv), dat als basis dient voor de EfficientNets-modellenfamilie.

In tests heeft EfficientNets zowel een hogere nauwkeurigheid als een betere efficiëntie aangetoond dan bestaande CNN's, waardoor de parametergrootte en de benodigde rekenbronnen met een orde van grootte zijn verminderd. Eén van de modellen, EfficientNet-B7, demonstreerde een 8,4 keer kleiner formaat en 6,1 keer betere prestaties dan de beroemde CNN Gpipe, en behaalde ook een nauwkeurigheid van 84,4% en 97,1% (Top-1 en Top-5). de ImageNet-set. Vergeleken met de populaire CNN ResNet-50 behaalde een ander EfficientNet-model, EfficientNet-B4, dat vergelijkbare bronnen gebruikte, een nauwkeurigheid van 82,6% versus 76,3% voor ResNet-50.

EfficientNets-modellen presteerden goed op andere datasets en bereikten een hoge nauwkeurigheid op vijf van de acht benchmarks, waaronder de CIFAR-100-dataset (91,7% nauwkeurigheid) en Bloemen (98,8%).

Het nieuwe neurale netwerk van Google is aanzienlijk nauwkeuriger en sneller dan populaire analogen

“Door aanzienlijke verbeteringen aan te brengen in de efficiëntie van neurale modellen, verwachten we dat EfficientNets het potentieel heeft om te dienen als een nieuw raamwerk voor toekomstige computer vision-taken”, schrijven Tan en Li.

Broncode en trainingsscripts voor de cloud Tensor Processing Units (TPU's) van Google zijn gratis beschikbaar op GitHub.



Bron: 3dnews.ru

Voeg een reactie