Mtandao mpya wa neural wa Google ni sahihi zaidi na haraka zaidi kuliko analogi maarufu

Mitandao ya neva ya kubadilisha (CNNs), ikichochewa na michakato ya kibiolojia katika gamba la kuona la binadamu, inafaa vyema kwa kazi kama vile utambuzi wa kitu na uso, lakini kuboresha usahihi wake kunahitaji kuchosha na kurekebisha vizuri. Ndio maana wanasayansi katika Utafiti wa Google AI wanagundua miundo mipya ambayo inasawazisha CNN kwa njia "iliyopangwa zaidi". Walichapisha matokeo ya kazi zao katika Ibara ya "EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks," iliyochapishwa kwenye tovuti ya kisayansi ya Arxiv.org, na pia katika machapisho kwenye blogu yako. Waandishi wenza wanadai kuwa familia ya mifumo ya kijasusi bandia, inayoitwa EfficientNets, inazidi usahihi wa CNN za kawaida na huongeza ufanisi wa mtandao wa neva kwa hadi mara 10.

Mtandao mpya wa neural wa Google ni sahihi zaidi na haraka zaidi kuliko analogi maarufu

"Tabia ya kawaida ya miundo ya kuongeza alama ni kuongeza kiholela kina au upana wa CNN, na kutumia mwonekano wa juu zaidi wa picha ya uingizaji kwa mafunzo na tathmini," anaandika mhandisi wa programu ya wafanyikazi Mingxing Tan na mwanasayansi mkuu wa Google AI Quoc V .Le). "Tofauti na mbinu za kitamaduni ambazo hupima vigezo vya mtandao kiholela kama vile upana, kina, na azimio la ingizo, mbinu yetu hupima kwa usawa kila kipimo na seti maalum ya vipengele vya kuongeza alama."

Ili kuboresha zaidi utendakazi, watafiti wanatetea kutumia mtandao mpya wa uti wa mgongo, ubadilishanaji wa chupa ya simu ya rununu (MBConv), ambayo hutumika kama msingi wa familia ya EfficientNets ya mifano.

Katika majaribio, EfficientNets imeonyesha usahihi wa juu na ufanisi bora zaidi kuliko CNN zilizopo, kupunguza ukubwa wa kigezo na mahitaji ya rasilimali ya kukokotoa kwa mpangilio wa ukubwa. Mojawapo ya miundo, EfficientNet-B7, ilionyesha ukubwa mdogo mara 8,4 na utendakazi bora mara 6,1 kuliko CNN Gpipe maarufu, na pia ilipata usahihi wa 84,4% na 97,1% (Juu-1 na Juu-5). Matokeo 50) katika majaribio kwenye seti ya ImageNet. Ikilinganishwa na CNN ResNet-4 maarufu, modeli nyingine ya EfficientNet, EfficientNet-B82,6, ikitumia rasilimali sawa, ilipata usahihi wa 76,3% dhidi ya 50% kwa ResNet-XNUMX.

Miundo ya EfficientNets ilifanya vyema kwenye seti nyingine za data, na kupata usahihi wa juu kwenye vigezo vitano kati ya nane, ikijumuisha mkusanyiko wa data wa CIFAR-100 (usahihi wa 91,7%) na maua (98,8%).

Mtandao mpya wa neural wa Google ni sahihi zaidi na haraka zaidi kuliko analogi maarufu

"Kwa kutoa maboresho makubwa katika ufanisi wa miundo ya neva, tunatarajia kwamba EfficientNets ina uwezo wa kutumika kama mfumo mpya wa kazi za maono ya kompyuta ya baadaye," Tan na Li wanaandika.

Msimbo wa chanzo na hati za mafunzo za Vitengo vya Uchakataji vya Tensor za wingu (TPUs) zinapatikana bila malipo kwenye Github.



Chanzo: 3dnews.ru

Kuongeza maoni