A nova rede neuronal de Google é significativamente máis precisa e rápida que os análogos populares

As redes neuronais convolucionais (CNN), inspiradas en procesos biolóxicos no córtex visual humano, son moi adecuadas para tarefas como o recoñecemento de obxectos e rostros, pero mellorar a súa precisión require un tedioso e afinado. É por iso que os científicos de Google AI Research están a explorar novos modelos que escalan as CNN dun xeito "máis estruturado". Publicaron os resultados do seu traballo en Artigo "EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks", publicado no portal científico Arxiv.org, así como en Publicación no teu blog. Os coautores afirman que a familia de sistemas de intelixencia artificial, chamada EfficientNets, supera a precisión das CNN estándar e aumenta a eficiencia dunha rede neuronal ata 10 veces.

A nova rede neuronal de Google é significativamente máis precisa e rápida que os análogos populares

"A práctica común dos modelos de escala é aumentar arbitrariamente a profundidade ou a anchura da CNN e utilizar unha resolución máis alta da imaxe de entrada para adestramento e avaliación", escriben o enxeñeiro de software Mingxing Tan e o científico principal de Google AI Quoc V .Le). "A diferenza dos enfoques tradicionais que escalan arbitrariamente os parámetros da rede como o ancho, a profundidade e a resolución de entrada, o noso método escala uniformemente cada dimensión cun conxunto fixo de factores de escala".

Para mellorar aínda máis o rendemento, os investigadores defenden o uso dunha nova rede troncal, a convolución móbil de pescozo de botella invertido (MBConv), que serve como base para a familia de modelos EfficientNets.

Nas probas, EfficientNets demostrou unha maior precisión e unha mellor eficiencia que as CNN existentes, reducindo o tamaño dos parámetros e os requisitos de recursos computacionais nunha orde de magnitude. Un dos modelos, EfficientNet-B7, demostrou un tamaño 8,4 veces menor e un rendemento 6,1 veces mellor que o famoso Gpipe de CNN, e tamén logrou unha precisión do 84,4 % e do 97,1 % (resultado Top-1 e Top-5). o conxunto ImageNet. En comparación co popular CNN ResNet-50, outro modelo EfficientNet, EfficientNet-B4, que utiliza recursos similares, logrou unha precisión do 82,6% fronte ao 76,3% para ResNet-50.

Os modelos EfficientNets tiveron un bo rendemento noutros conxuntos de datos, logrando unha alta precisión en cinco dos oito puntos de referencia, incluíndo o conxunto de datos CIFAR-100 (precisión do 91,7%) e Flores (98,8%).

A nova rede neuronal de Google é significativamente máis precisa e rápida que os análogos populares

"Ao proporcionar melloras significativas na eficiencia dos modelos neuronais, esperamos que EfficientNets teña o potencial de servir como un novo marco para futuras tarefas de visión por ordenador", escriben Tan e Li.

O código fonte e os scripts de adestramento para as Unidades de procesamento de tensor (TPU) de Google están dispoñibles gratuitamente Github.



Fonte: 3dnews.ru

Engadir un comentario