A nova rede neural do Google é significativamente mais precisa e rápida do que suas contrapartes populares

As redes neurais convolucionais (CNNs), inspiradas em processos biológicos no córtex visual humano, são adequadas para tarefas como reconhecimento de objetos e rostos, mas melhorar sua precisão requer ajustes tediosos e precisos. É por isso que os cientistas do Google AI Research estão explorando novos modelos que dimensionam as CNNs de uma forma “mais estruturada”. Eles publicaram os resultados de seu trabalho em статье “EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks”, publicado no portal científico Arxiv.org, bem como em publicações no seu blog. Os coautores afirmam que a família de sistemas de inteligência artificial, chamada EfficientNets, excede a precisão das CNNs padrão e aumenta a eficiência de uma rede neural em até 10 vezes.

A nova rede neural do Google é significativamente mais precisa e rápida do que suas contrapartes populares

“A prática comum de dimensionar modelos é aumentar arbitrariamente a profundidade ou largura da CNN e usar resolução mais alta da imagem de entrada para treinamento e avaliação”, escrevem o engenheiro de software Mingxing Tan e o cientista-chefe de IA do Google, Quoc V.Le). “Ao contrário das abordagens tradicionais que dimensionam arbitrariamente parâmetros de rede, como largura, profundidade e resolução de entrada, nosso método dimensiona uniformemente cada dimensão com um conjunto fixo de fatores de escala.”

Para melhorar ainda mais o desempenho, os pesquisadores defendem o uso de uma nova rede de backbone, a convolução de gargalo invertido móvel (MBConv), que serve de base para a família de modelos EfficientNets.

Nos testes, o EfficientNets demonstrou maior precisão e melhor eficiência do que as CNNs existentes, reduzindo o tamanho dos parâmetros e os requisitos de recursos computacionais em uma ordem de grandeza. Um dos modelos, EfficientNet-B7, demonstrou tamanho 8,4 vezes menor e desempenho 6,1 vezes melhor que o famoso CNN Gpipe, e também alcançou 84,4% e 97,1% de precisão (resultado Top-1 e Top-5) em testes em o conjunto ImageNet. Comparado ao popular CNN ResNet-50, outro modelo EfficientNet, o EfficientNet-B4, usando recursos semelhantes, alcançou uma precisão de 82,6% contra 76,3% do ResNet-50.

Os modelos EfficientNets tiveram um bom desempenho em outros conjuntos de dados, alcançando alta precisão em cinco dos oito benchmarks, incluindo o conjunto de dados CIFAR-100 (91,7% de precisão) e Flores (98,8%).

A nova rede neural do Google é significativamente mais precisa e rápida do que suas contrapartes populares

“Ao fornecer melhorias significativas na eficiência dos modelos neurais, esperamos que o EfficientNets tenha o potencial de servir como uma nova estrutura para futuras tarefas de visão computacional”, escrevem Tan e Li.

O código-fonte e os scripts de treinamento para as unidades de processamento de tensores (TPUs) em nuvem do Google estão disponíveis gratuitamente em Github.



Fonte: 3dnews.ru

Adicionar um comentário