La nova xarxa neuronal de Google és molt més precisa i ràpida que els seus homòlegs populars

Les xarxes neuronals convolucionals (CNN), inspirades en processos biològics de l'escorça visual humana, són molt adequades per a tasques com el reconeixement d'objectes i cares, però millorar-ne la precisió requereix un ajustament tediós i fi. És per això que els científics de Google AI Research estan explorant nous models que escalen les CNN d'una manera "més estructurada". Van publicar els resultats del seu treball a article "EfficientNet: repensar l'escala de models per a xarxes neuronals convolucionals", publicat al portal científic Arxiv.org, així com a Publicació al teu bloc. Els coautors afirmen que la família de sistemes d'intel·ligència artificial, anomenada EfficientNets, supera la precisió de les CNN estàndard i augmenta l'eficiència d'una xarxa neuronal fins a 10 vegades.

La nova xarxa neuronal de Google és molt més precisa i ràpida que els seus homòlegs populars

"La pràctica habitual d'escalar models és augmentar arbitràriament la profunditat o l'amplada de la CNN i utilitzar una resolució més alta de la imatge d'entrada per a la formació i l'avaluació", escriuen l'enginyer de programari del personal Mingxing Tan i el científic principal de Google AI Quoc V .Le). "A diferència dels enfocaments tradicionals que escalen arbitràriament paràmetres de xarxa com ara l'amplada, la profunditat i la resolució d'entrada, el nostre mètode escala uniformement cada dimensió amb un conjunt fix de factors d'escala".

Per millorar encara més el rendiment, els investigadors defensen l'ús d'una nova xarxa troncal, la convolució de coll d'ampolla invertida mòbil (MBConv), que serveix de base per a la família de models EfficientNets.

En les proves, EfficientNets ha demostrat una major precisió i una millor eficiència que les CNN existents, reduint la mida dels paràmetres i els requisits de recursos computacionals en un ordre de magnitud. Un dels models, EfficientNet-B7, va demostrar una mida 8,4 vegades més petita i un rendiment 6,1 vegades millor que el famós Gpipe de CNN, i també va aconseguir un 84,4% i un 97,1% de precisió (Top-1 i Top-5). el conjunt ImageNet. En comparació amb el popular CNN ResNet-50, un altre model EfficientNet, EfficientNet-B4, utilitzant recursos similars, va aconseguir una precisió del 82,6% enfront del 76,3% de ResNet-50.

Els models EfficientNets van tenir un bon rendiment en altres conjunts de dades, aconseguint una alta precisió en cinc dels vuit punts de referència, inclòs el conjunt de dades CIFAR-100 (precisió del 91,7%) i Flors (98,8%).

La nova xarxa neuronal de Google és molt més precisa i ràpida que els seus homòlegs populars

"En oferir millores significatives en l'eficiència dels models neuronals, esperem que EfficientNets tingui el potencial de servir com a nou marc per a futures tasques de visió per ordinador", escriuen Tan i Li.

El codi font i els scripts d'entrenament per a les unitats de processament de tensors del núvol (TPU) de Google estan disponibles gratuïtament Github.



Font: 3dnews.ru

Afegeix comentari