Googlening yangi neyron tarmog'i mashhur analoglardan sezilarli darajada aniqroq va tezroq

Insonning vizual korteksidagi biologik jarayonlardan ilhomlangan konvolyutsion neyron tarmoqlari (CNN) ob'ekt va yuzni aniqlash kabi vazifalar uchun juda mos keladi, ammo ularning aniqligini oshirish zerikarli va nozik sozlashni talab qiladi. Shu sababli Google AI Research olimlari CNN-larni “ko‘proq tuzilgan” tarzda kengaytiruvchi yangi modellarni o‘rganmoqda. Ular o'z ishlarining natijalarini nashr etishdi maqola Arxiv.org ilmiy portalida e'lon qilingan "EfficientNet: Konvolyutsion neyron tarmoqlari uchun model miqyosini qayta ko'rib chiqish", shuningdek, adabiyotlar blogingizda. Hammualliflarning ta'kidlashicha, EfficientNets deb nomlangan sun'iy intellekt tizimlari oilasi standart CNN aniqligidan oshib ketadi va neyron tarmoq samaradorligini 10 barobargacha oshiradi.

Googlening yangi neyron tarmog'i mashhur analoglardan sezilarli darajada aniqroq va tezroq

"Modellarni masshtablashning keng tarqalgan amaliyoti CNNning chuqurligini yoki kengligini o'zboshimchalik bilan oshirish va o'qitish va baholash uchun kirish tasvirining yuqori aniqligidan foydalanishdir", deb yozadi dasturiy ta'minot muhandisi Mingxing Tan va Google AI yetakchi olimi Quoc V .Le). "Tarmoqning kenglik, chuqurlik va kirish ruxsati kabi parametrlarini o'zboshimchalik bilan o'lchaydigan an'anaviy yondashuvlardan farqli o'laroq, bizning usulimiz har bir o'lchovni belgilangan o'lchov omillari to'plami bilan bir xilda o'lchaydi."

Ishlashni yanada yaxshilash uchun tadqiqotchilar EfficientNets modellar oilasi uchun asos bo'lib xizmat qiladigan yangi magistral tarmoqdan, mobil inverted bottleneck convolution (MBConv) dan foydalanishni targ'ib qilmoqdalar.

Sinovlarda EfficientNets mavjud CNN-larga qaraganda yuqori aniqlik va yaxshi samaradorlikni namoyish etdi, bu parametr o'lchamini va hisoblash resurslariga bo'lgan talablarni kattalik tartibida qisqartirdi. Modellardan biri EfficientNet-B7 mashhur CNN Gpipe’ga qaraganda 8,4 baravar kichikroq o‘lcham va 6,1 baravar yaxshi ishlashini namoyish etdi, shuningdek, test sinovlarida 84,4% va 97,1% (Top-1 va Top-5) aniqlikka erishdi. ImageNet to'plami. Mashhur CNN ResNet-50 bilan taqqoslaganda, shunga o'xshash resurslardan foydalangan holda EfficientNet-ning boshqa modeli EfficientNet-B4 ResNet-82,6 uchun 76,3% ga nisbatan 50% aniqlikka erishdi.

EfficientNets modellari boshqa ma'lumotlar to'plamlarida yaxshi ishladi va sakkizta mezondan beshtasida yuqori aniqlikka erishdi, jumladan CIFAR-100 ma'lumotlar to'plami (91,7% aniqlik) va Gullar (98,8%).

Googlening yangi neyron tarmog'i mashhur analoglardan sezilarli darajada aniqroq va tezroq

"Neyron modellarining samaradorligini sezilarli darajada oshirishni ta'minlash orqali biz EfficientNets kelajakda kompyuterni ko'rish vazifalari uchun yangi asos bo'lib xizmat qilish potentsialiga ega bo'lishini kutamiz", deb yozadi Tan va Li.

Google bulutli Tensor Processing Units (TPU) uchun manba kodi va oʻquv skriptlari bepul mavjud. Github.



Manba: 3dnews.ru

a Izoh qo'shish