Google-ren sare neuronal berria analogiko ezagunek baino askoz zehatzagoa eta azkarragoa da

Sare neuronal konboluzionalak (CNN), gizakiaren ikusmen-kortexean dauden prozesu biologikoetan inspiratuta, oso egokiak dira objektuak eta aurpegiak hautemateko zereginetarako, baina haien zehaztasuna hobetzeak neketsua eta doikuntza zehatza eskatzen du. Horregatik, Google AI Research-eko zientzialariak CNNak modu "egituratuagoan" eskalatzen dituzten eredu berriak aztertzen ari dira. urtean argitaratu dituzte euren lanaren emaitzak Artikulu "EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks", Arxiv.org atari zientifikoan argitaratua, baita Argitalpena zure blogean. Egileek diotenez, EfficientNets izeneko adimen artifizialaren sistemen familiak CNN estandarren zehaztasuna gainditzen duela eta sare neuronal baten eraginkortasuna 10 aldiz handitzen du.

Google-ren sare neuronal berria analogiko ezagunek baino askoz zehatzagoa eta azkarragoa da

"Ereduak eskalatzeko ohiko praktika CNNren sakonera edo zabalera arbitrarioki handitzea da, eta sarrerako irudiaren bereizmen handiagoa erabiltzea trebakuntzarako eta ebaluaziorako", idatzi dute Mingxing Tan langileen software ingeniariak eta Quoc V .Le Google AI zientzialari nagusiak. "Sareko parametroak zabalera, sakonera eta sarrerako bereizmena modu arbitrarioan eskalatzen dituzten ikuspegi tradizionalek ez bezala, gure metodoak uniformeki eskalatzen du dimentsio bakoitza eskalatze-faktore multzo finko batekin".

Errendimendua are gehiago hobetzeko, ikertzaileek bizkarrezurreko sare berri bat erabiltzea defendatzen dute, mugikorraren alderantzizko botila-lepoko konboluzioa (MBConv), zeina EfficientNets ereduen familiako oinarri gisa balio duena.

Probetan, EfficientNetsek lehendik dauden CNNek baino zehaztasun handiagoa eta eraginkortasun hobea frogatu du, parametroen tamaina eta baliabide konputazionalaren eskakizunak magnitude batean murriztuz. Ereduetako batek, EfficientNet-B7, CNN Gpipe ospetsuak baino 8,4 aldiz tamaina txikiagoa eta 6,1 aldiz errendimendu hobea frogatu zuen, eta % 84,4 eta % 97,1eko zehaztasuna ere lortu zuen (Top-1 eta Top-5). 50 emaitza) proban. ImageNet multzoa. CNN ResNet-4 ezagunarekin alderatuta, EfficientNet-en beste eredu batek, EfficientNet-B82,6k, antzeko baliabideak erabiliz, % 76,3ko zehaztasuna lortu zuen ResNet-50-ren % XNUMXko zehaztasuna.

EfficientNets-en ereduak ondo aritu ziren beste datu-multzo batzuetan, zehaztasun handia lortu zuten zortzi erreferentzietatik bostetan, CIFAR-100 datu-multzoan barne (% 91,7ko zehaztasuna) eta Flowers (% 98,8).

Google-ren sare neuronal berria analogiko ezagunek baino askoz zehatzagoa eta azkarragoa da

"Eredu neuronalen eraginkortasunean hobekuntza esanguratsuak eskainiz, EfficientNets-ek etorkizuneko ordenagailu bidezko ikusmeneko zereginetarako esparru berri gisa balioko duela espero dugu", idatzi dute Tanek eta Lik.

Google-ren hodeiko Tensor Processing Unit (TPU) iturburu-kodea eta prestakuntza-gidoiak doan eskuragarri daude Github.



Iturria: 3dnews.ru

Gehitu iruzkin berria