Новата невронна мрежа на Google е много по-точна и по-бърза от популярните аналози

Конволюционните невронни мрежи (CNN), вдъхновени от биологичните процеси в човешкия зрителен кортекс, са много подходящи за задачи като разпознаване на обекти и лица, но подобряването на тяхната точност изисква досадна и фина настройка. Ето защо учените от Google AI Research изследват нови модели, които „мащабират“ CNN по „по-структуриран“ начин. Те публикуваха резултата от работата си в Статия „EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks“, хостван от научния портал Arxiv.org, както и в Публикуване във вашия блог. Съавторите твърдят, че семейството системи с изкуствен интелект, наречено EfficientNets, надвишава точността на стандартните CNN и подобрява ефективността на невронната мрежа до 10 пъти.

Новата невронна мрежа на Google е много по-точна и по-бърза от популярните аналози

„Обща практика за мащабиране на модели е произволно увеличаване на дълбочината или ширината на CNN, както и използване на по-висока разделителна способност на входното изображение за обучение и оценка“, пишат вътрешният софтуерен инженер Mingxing Tan и водещ учен в Google AI Куок Ли (Quoc V .le). „За разлика от традиционните подходи, които произволно мащабират мрежови параметри като ширина, дълбочина и входяща резолюция, нашият метод равномерно мащабира всяко измерение с фиксиран набор от коефициенти на мащабиране.“

За по-нататъшно подобряване на производителността, изследователите препоръчват използването на нова основна мрежа, мобилната инвертирана конволюция на тесни места (MBConv), която служи като основа за фамилията модели EfficientNets.

При тестове EfficientNets демонстрира както по-висока точност, така и по-добра ефективност от съществуващите CNN, намалявайки изискването за размер на параметрите и изчислителните ресурси с порядък. Един от моделите, EfficientNet-B7, демонстрира 8,4 пъти по-малък размер и 6,1 пъти по-добра производителност от добре познатия CNN Gpipe и също така постигна 84,4% и 97,1% точност (резултат Топ-1 и Топ-5) при тестване на Комплект ImageNet. В сравнение с популярния CNN ResNet-50, друг модел на EfficientNet, EfficientNet-B4, използващ подобни ресурси, показа точност от 82,6% срещу 76,3% за ResNet-50.

Моделите EfficientNets се представиха добре при други набори от данни, постигайки висока точност в пет от осем теста, включително CIFAR-100 (91,7% точност) и Цветя (98,8%).

Новата невронна мрежа на Google е много по-точна и по-бърза от популярните аналози

„Чрез предоставяне на значителни подобрения в производителността на невронните модели, очакваме EfficientNets потенциално да послужи като нова основа за бъдещи предизвикателства на компютърното зрение“, пишат Тан и Ли.

Изходният код и скриптовете за обучение за Google Cloud Tensor Processing Units (TPU) са свободно достъпни на Github.



Източник: 3dnews.ru

Добавяне на нов коментар