Mae rhwydwaith niwral newydd Google yn llawer mwy cywir a chyflymach na'i gymheiriaid poblogaidd

Mae rhwydweithiau niwral convolutional (CNNs), a ysbrydolwyd gan brosesau biolegol yn y cortecs gweledol dynol, yn addas iawn ar gyfer tasgau fel adnabod gwrthrychau ac wynebau, ond mae gwella eu cywirdeb yn gofyn am diwnio diflas a manwl. Dyna pam mae gwyddonwyr yn Google AI Research yn archwilio modelau newydd sy'n "graddio" CNNs mewn ffordd "fwy strwythuredig". Cyhoeddasant ffrwyth eu gwaith yn Erthygl "EfficientNet: Ailfeddwl Graddio Model ar gyfer Rhwydweithiau Niwral Convolutional", a gynhelir gan y porth gwyddonol Arxiv.org, yn ogystal ag yn Cyhoeddi ar eich blog. Mae'r cyd-awduron yn honni bod y teulu o systemau deallusrwydd artiffisial, o'r enw EfficientNets, yn rhagori ar gywirdeb CNNs safonol ac yn gwella effeithlonrwydd rhwydwaith niwral hyd at 10 gwaith.

Mae rhwydwaith niwral newydd Google yn llawer mwy cywir a chyflymach na'i gymheiriaid poblogaidd

“Arfer cyffredin ar gyfer modelau graddio yw cynyddu dyfnder neu led y CNN yn fympwyol, yn ogystal â defnyddio cydraniad uwch o’r ddelwedd fewnbwn ar gyfer hyfforddi a gwerthuso,” ysgrifennwch y peiriannydd meddalwedd mewnol Mingxing Tan a’r gwyddonydd arweiniol yn Google AI Quoc Li (Quoc V .le). "Yn wahanol i ddulliau traddodiadol sy'n graddio paramedrau rhwydwaith yn fympwyol fel lled, dyfnder, a datrysiad sy'n dod i mewn, mae ein dull yn graddio pob dimensiwn yn unffurf gyda set sefydlog o ffactorau graddio."

Er mwyn gwella perfformiad ymhellach, mae'r ymchwilwyr yn argymell y defnydd o rwydwaith craidd newydd, y convolution dagfa inverted symudol (MBConv), sy'n gwasanaethu fel sail ar gyfer y teulu EfficientNets o fodelau.

Mewn profion, mae EfficientNets wedi dangos cywirdeb uwch a gwell effeithlonrwydd na'r CNNs presennol, gan leihau'r gofyniad am faint paramedr ac adnoddau cyfrifiadurol yn ôl trefn maint. Dangosodd un o'r modelau, EfficientNet-B7, 8,4 gwaith yn llai o faint a pherfformiad 6,1 gwaith yn well na'r CNN Gpipe adnabyddus, a chyflawnodd hefyd gywirdeb 84,4% a 97,1% (canlyniad Top-1 a Top-5) mewn profion ar y Set ImageNet. O'i gymharu â'r CNN ResNet-50 poblogaidd, dangosodd model EfficientNet arall, EfficientNet-B4, gan ddefnyddio adnoddau tebyg, gywirdeb o 82,6% yn erbyn 76,3% ar gyfer ResNet-50.

Perfformiodd modelau EfficientNets yn dda ar setiau data eraill, gan gyflawni cywirdeb uchel mewn pump allan o wyth prawf, gan gynnwys y CIFAR-100 (cywirdeb 91,7%) a blodau (98,8%).

Mae rhwydwaith niwral newydd Google yn llawer mwy cywir a chyflymach na'i gymheiriaid poblogaidd

“Trwy gyflawni gwelliannau sylweddol ym mherfformiad modelau niwral, rydym yn disgwyl i EfficientNets o bosibl wasanaethu fel sylfaen newydd ar gyfer heriau gweledigaeth gyfrifiadurol yn y dyfodol,” mae Tan a Li yn ysgrifennu.

Mae'r cod ffynhonnell a'r sgriptiau tiwtorial ar gyfer Unedau Prosesu Tensor Google Cloud (TPUs) ar gael am ddim yn Github.



Ffynhonnell: 3dnewyddion.ru

Ychwanegu sylw