Google-дың жаңа нейрондық желісі танымал аналогтарға қарағанда айтарлықтай дәлірек және жылдамырақ

Адамның көру қабығындағы биологиялық процестерден шабыттандырылған конволюционды нейрондық желілер (CNN) нысанды және бетті тану сияқты тапсырмалар үшін өте қолайлы, бірақ олардың дәлдігін жақсарту жалықтырғыш және дәл реттеуді қажет етеді. Сондықтан Google AI Research ғалымдары CNN-ді «неғұрлым құрылымдалған» түрде масштабтайтын жаңа үлгілерді зерттеп жатыр. Олар өз жұмыстарының нәтижелерін жариялады мақала Arxiv.org ғылыми порталында жарияланған «EfficientNet: конволюциялық нейрондық желілер үшін модельді масштабтауды қайта қарастыру», сондай-ақ басылымдар сіздің блогыңызда. Бірлескен авторлар EfficientNets деп аталатын жасанды интеллект жүйелерінің отбасы стандартты CNN дәлдігінен асып түседі және нейрондық желінің тиімділігін 10 есеге дейін арттырады деп мәлімдейді.

Google-дың жаңа нейрондық желісі танымал аналогтарға қарағанда айтарлықтай дәлірек және жылдамырақ

«Модельдерді масштабтаудың кең таралған тәжірибесі - CNN тереңдігін немесе енін ерікті түрде ұлғайту және оқыту мен бағалау үшін кіріс кескінінің жоғарырақ ажыратымдылығын пайдалану», - деп жазады бағдарламалық қамтамасыз ету инженері Минсин Тан және Google AI жетекші ғалымы Куок В.Ле). «Ені, тереңдігі және кіріс рұқсаты сияқты желі параметрлерін ерікті түрде масштабтайтын дәстүрлі тәсілдерден айырмашылығы, біздің әдіс масштабтау факторларының бекітілген жиынтығымен әрбір өлшемді біркелкі масштабтайды».

Жұмысты одан әрі жақсарту үшін зерттеушілер EfficientNets модельдер тобына негіз болатын жаңа магистральдық желіні, мобильді инверттелген кедергі конвульсиясын (MBConv) пайдалануды жақтайды.

Сынақтарда EfficientNets қолданыстағы CNN-ге қарағанда жоғары дәлдік пен тиімділікті көрсетті, бұл параметр өлшемін және есептеу ресурстарына қойылатын талаптарды шама ретімен азайтты. Модельдердің бірі EfficientNet-B7 атақты CNN Gpipe-ге қарағанда 8,4 есе кішірек өлшемді және 6,1 есе жақсы өнімділікті көрсетті, сонымен қатар тестілеуде 84,4% және 97,1% дәлдікке (Топ-1 және Топ-5) қол жеткізді. ImageNet жинағы. Танымал CNN ResNet-50-мен салыстырғанда, EfficientNet-тің басқа үлгісі, EfficientNet-B4 ұқсас ресурстарды пайдалана отырып, ResNet-82,6 үшін 76,3% қарсы 50% дәлдікке қол жеткізді.

EfficientNets үлгілері CIFAR-100 деректер жинағын (91,7% дәлдік) және Гүлдерді (98,8%).

Google-дың жаңа нейрондық желісі танымал аналогтарға қарағанда айтарлықтай дәлірек және жылдамырақ

«Нейрондық модельдердің тиімділігін айтарлықтай жақсартуды қамтамасыз ете отырып, біз EfficientNets болашақ компьютерлік көру тапсырмалары үшін жаңа негіз ретінде қызмет ете алады деп күтеміз», - деп жазды Тан мен Ли.

Google бұлттық тензорлық өңдеу бірліктері (TPU) үшін бастапқы код және оқу сценарийлері мына жерде тегін қолжетімді GitHub.



Ақпарат көзі: 3dnews.ru

пікір қалдыру