Le nouveau réseau neuronal de Google est nettement plus précis et plus rapide que ses homologues populaires

Les réseaux de neurones convolutifs (CNN), inspirés des processus biologiques du cortex visuel humain, sont bien adaptés à des tâches telles que la reconnaissance d'objets et de visages, mais l'amélioration de leur précision nécessite un réglage fastidieux et précis. C'est pourquoi les scientifiques de Google AI Research explorent de nouveaux modèles qui mettent à l'échelle les CNN de manière « plus structurée ». Ils ont publié les résultats de leurs travaux dans article « EfficientNet : Rethinking Model Scaling for Convolutional Neural Networks », publié sur le portail scientifique Arxiv.org, ainsi que dans Publication sur votre blog. Les co-auteurs affirment que la famille de systèmes d’intelligence artificielle, appelée EfficientNets, dépasse la précision des CNN standards et augmente jusqu’à 10 fois l’efficacité d’un réseau neuronal.

Le nouveau réseau neuronal de Google est nettement plus précis et plus rapide que ses homologues populaires

"La pratique courante de mise à l'échelle des modèles consiste à augmenter arbitrairement la profondeur ou la largeur du CNN et à utiliser une résolution plus élevée de l'image d'entrée pour la formation et l'évaluation", écrivent l'ingénieur logiciel Mingxing Tan et le scientifique principal de Google AI Quoc V.Le). "Contrairement aux approches traditionnelles qui mettent à l'échelle arbitrairement les paramètres du réseau tels que la largeur, la profondeur et la résolution d'entrée, notre méthode met à l'échelle uniformément chaque dimension avec un ensemble fixe de facteurs de mise à l'échelle."

Pour améliorer encore les performances, les chercheurs préconisent l'utilisation d'un nouveau réseau fédérateur, la convolution de goulot d'étranglement inversé mobile (MBConv), qui sert de base à la famille de modèles EfficientNets.

Lors des tests, EfficientNets a démontré à la fois une plus grande précision et une meilleure efficacité que les CNN existants, réduisant ainsi la taille des paramètres et les besoins en ressources de calcul d'un ordre de grandeur. L'un des modèles, EfficientNet-B7, a démontré une taille 8,4 fois plus petite et des performances 6,1 fois supérieures à celles du célèbre CNN Gpipe, et a également atteint une précision de 84,4 % et 97,1 % (résultat Top-1 et Top-5) lors des tests sur l'ensemble ImageNet. Comparé au populaire CNN ResNet-50, un autre modèle EfficientNet, EfficientNet-B4, utilisant des ressources similaires, a atteint une précision de 82,6 % contre 76,3 % pour ResNet-50.

Les modèles EfficientNets ont donné de bons résultats sur d'autres ensembles de données, atteignant une précision élevée sur cinq des huit références, y compris l'ensemble de données CIFAR-100 (précision de 91,7 %) et Fleurs (98,8%).

Le nouveau réseau neuronal de Google est nettement plus précis et plus rapide que ses homologues populaires

"En apportant des améliorations significatives dans l'efficacité des modèles neuronaux, nous espérons qu'EfficientNets aura le potentiel de servir de nouveau cadre pour les futures tâches de vision par ordinateur", écrivent Tan et Li.

Le code source et les scripts de formation pour les unités de traitement Tensor (TPU) cloud de Google sont disponibles gratuitement sur Github.



Source: 3dnews.ru

Ajouter un commentaire