Новата невронска мрежа на Google е значително попрецизна и побрза од популарните аналози

Конволуционите невронски мрежи (CNN), инспирирани од биолошките процеси во човечкиот визуелен кортекс, се добро прилагодени за задачи како што се препознавање предмети и лица, но подобрувањето на нивната точност бара досадни и фино подесување. Затоа научниците од Google AI Research истражуваат нови модели кои ги размеруваат CNN на „поструктуиран“ начин. Тие ги објавија резултатите од нивната работа во Член „EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks“, објавено на научниот портал Arxiv.org, како и во Објавување на вашиот блог. Коавторите тврдат дека семејството на системи за вештачка интелигенција, наречено EfficientNets, ја надминува точноста на стандардните CNN и ја зголемува ефикасноста на невронската мрежа до 10 пати.

Новата невронска мрежа на Google е значително попрецизна и побрза од популарните аналози

„Вообичаената практика на моделите за скалирање е произволно да се зголемува длабочината или ширината на CNN и да се користи повисока резолуција на влезната слика за обука и евалуација“, пишуваат софтверскиот инженер од персоналот Мингсинг Тан и водечкиот научник за вештачка интелигенција на Google, Quoc V. Le. „За разлика од традиционалните пристапи кои произволно ги размеруваат мрежните параметри како што се ширината, длабочината и влезната резолуција, нашиот метод рамномерно ја скалира секоја димензија со фиксен сет на фактори за скалирање.

За понатамошно подобрување на перформансите, истражувачите се залагаат за користење на нова основна мрежа, мобилна инвертирана тесно грло (MBConv), која служи како основа за семејството на модели EfficientNets.

Во тестовите, EfficientNets покажа и поголема точност и подобра ефикасност од постоечките CNN, намалувајќи ја големината на параметарот и барањата за пресметковни ресурси по ред на големина. Еден од моделите, EfficientNet-B7, покажа 8,4 пати помала големина и 6,1 пати подобри перформанси од познатиот CNN Gpipe, а исто така постигна 84,4% и 97,1% точност (Top-1 и Top-5). 50 резултат) при тестирањето на множеството ImageNet. Во споредба со популарниот CNN ResNet-4, друг модел EfficientNet, EfficientNet-B82,6, користејќи слични ресурси, постигна точност од 76,3% наспроти 50% за ResNet-XNUMX.

Моделите EfficientNets се покажаа добро на другите збирки на податоци, постигнувајќи висока точност на пет од осумте одредници, вклучувајќи ја базата на податоци CIFAR-100 (91,7% точност) и Цвеќе (98,8%).

Новата невронска мрежа на Google е значително попрецизна и побрза од популарните аналози

„Со обезбедување на значителни подобрувања во ефикасноста на нервните модели, очекуваме дека EfficientNets има потенцијал да послужи како нова рамка за идните задачи за компјутерска визија“, пишуваат Тан и Ли.

Изворниот код и скриптите за обука за единиците за обработка на тензори (TPU) на облак на Google се слободно достапни на Github.



Извор: 3dnews.ru

Додадете коментар