Нова нейронна мережа Google значно точніша і швидше, ніж популярні аналоги

Згорткові нейронні мережі (англ. Convolutional neural networks — CNN), натхненні біологічними процесами в зоровій корі людини, добре підходять для таких завдань, як розпізнавання об'єктів та осіб, але підвищення точності їхньої роботи потребує стомливого та тонкого настроювання. Ось чому вчені з дослідницького відділу Google AI вивчають нові моделі, які «масштабують» CNN «структурованішим» способом. Результат своєї роботи вони опублікували у статті «EfficientNet: переосмислення масштабування моделей для згорткових нейронних мереж», розміщеної на науковому порталі Arxiv.org, а також публікації у своєму блозі. Співавтори стверджують, що сімейство систем штучного інтелекту, що отримало назву EfficientNets, перевищує точність стандартних CNN і підвищує ефективність нейронної мережі до 10 разів.

Нова нейронна мережа Google значно точніша і швидше, ніж популярні аналоги

"Звичайна практика масштабування моделей полягає у довільному збільшенні глибини або ширини CNN, а також використанні більшого дозволу вхідного зображення для навчання та оцінки", - пишуть штатний інженер-програміст Мінсінг Тан (Mingxing Tan) і провідний вчений у Google AI Куок Лі (Quoc V) .Le). «На відміну від традиційних підходів, які довільно масштабують параметри мережі, такі як ширина, глибина і роздільна здатність, наш метод рівномірно масштабує кожен вимір з фіксованим набором коефіцієнтів масштабування».

Для подальшого підвищення продуктивності дослідники виступають за використання нової базової мережі — мобільної інвертованої згортки вузького місця (MBConv), яка є основою для сімейства моделей EfficientNets.

У тестах EfficientNets продемонструвало як більш високу точність, так і кращу ефективність порівняно з існуючими CNN, на порядок зменшивши вимогу до розміру параметрів та обчислювальних ресурсів. Одна з моделей - EfficientNet-B7, продемонструвала в 8,4 рази менший розмір і в 6,1 рази кращу продуктивність, ніж відома CNN Gpipe, а також досягла 84,4% та 97,1% точності (Топ-1 та Топ- 5 результат) у тестуванні на наборі ImageNet. У порівнянні з популярною CNN ResNet-50, інша модель EfficientNet - EfficientNet-B4, використовуючи аналогічні ресурси, продемонструвала точність 82,6% проти 76,3% у ResNet-50.

Моделі EfficientNets добре показали себе і на інших наборах даних, досягнувши високої точності в п'яти з восьми тестів, включаючи набори CIFAR-100 (точність 91,7%) та Flowers (98,8%).

Нова нейронна мережа Google значно точніша і швидше, ніж популярні аналоги

"Забезпечуючи значні покращення ефективності нейронних моделей, ми очікуємо, що EfficientNets потенційно може послужити новою основою для майбутніх завдань у галузі комп'ютерного зору", - пишуть Тан і Лі.

Вихідний код та навчальні сценарії для хмарних тензорних процесорів (TPU) від Google знаходяться у вільному доступі на Github.



Джерело: 3dnews.ru

Додати коментар або відгук