La nueva red neuronal de Google es mucho más precisa y rápida que sus contrapartes populares

Las redes neuronales convolucionales (CNN), inspiradas en procesos biológicos en la corteza visual humana, son muy adecuadas para tareas como el reconocimiento de objetos y rostros, pero mejorar su precisión requiere un ajuste tedioso y fino. Es por eso que los científicos de Google AI Research están explorando nuevos modelos que "escalan" las CNN de una manera "más estructurada". Publicaron el resultado de su trabajo en статье "EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks", alojado en el portal científico Arxiv.org, así como en Publicación en tu blog Los coautores afirman que la familia de sistemas de inteligencia artificial, llamada EfficientNets, supera la precisión de las CNN estándar y mejora la eficiencia de una red neuronal hasta 10 veces.

La nueva red neuronal de Google es mucho más precisa y rápida que sus contrapartes populares

“Una práctica común para escalar modelos es aumentar arbitrariamente la profundidad o el ancho de la CNN, así como usar una resolución más alta de la imagen de entrada para entrenamiento y evaluación”, escribe el ingeniero de software interno Mingxing Tan y científico principal de Google AI. Quoc Li (Quoc V .le). "A diferencia de los enfoques tradicionales que escalan arbitrariamente los parámetros de la red, como el ancho, la profundidad y la resolución entrante, nuestro método escala uniformemente cada dimensión con un conjunto fijo de factores de escala".

Para mejorar aún más el rendimiento, los investigadores abogan por el uso de una nueva red central, la convolución de cuello de botella invertida móvil (MBConv), que sirve como base para la familia de modelos EfficientNets.

En las pruebas, EfficientNets ha demostrado una mayor precisión y una mejor eficiencia que las CNN existentes, lo que reduce el requisito de tamaño de parámetro y recursos computacionales en un orden de magnitud. Uno de los modelos, EfficientNet-B7, demostró un tamaño 8,4 veces más pequeño y un rendimiento 6,1 veces mejor que el conocido CNN Gpipe, y también logró una precisión del 84,4 % y el 97,1 % (resultado Top-1 y Top-5) en las pruebas en el Conjunto ImageNet. En comparación con el popular CNN ResNet-50, otro modelo de EfficientNet, EfficientNet-B4, que utiliza recursos similares, mostró una precisión del 82,6 % frente al 76,3 % de ResNet-50.

Los modelos EfficientNets funcionaron bien en otros conjuntos de datos, logrando una alta precisión en cinco de ocho pruebas, incluido el CIFAR-100 (91,7 % de precisión) y Flores (98,8%).

La nueva red neuronal de Google es mucho más precisa y rápida que sus contrapartes populares

“Al ofrecer mejoras significativas en el rendimiento de los modelos neuronales, esperamos que EfficientNets sirva potencialmente como una nueva base para futuros desafíos de visión por computadora”, escriben Tan y Li.

El código fuente y las secuencias de comandos del tutorial para las Unidades de procesamiento de tensores (TPU) de Google Cloud están disponibles gratuitamente en Github.



Fuente: 3dnews.ru

Añadir un comentario