Nýja taugakerfi Google er mun nákvæmara og hraðvirkara en vinsælar hliðstæður

Convolutional neural networks (CNN), innblásin af líffræðilegum ferlum í sjónberki mannsins, henta vel fyrir verkefni eins og hlut- og andlitsgreiningu, en að bæta nákvæmni þeirra krefst leiðinlegrar og fínstillingar. Þess vegna eru vísindamenn hjá Google AI Research að kanna ný líkön sem stækka CNN á „skipulagðari“ hátt. Þeir birtu niðurstöður vinnu sinnar í grein „EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks,“ birt á vísindagáttinni Arxiv.org, sem og í Birting á blogginu þínu. Meðhöfundarnir halda því fram að fjölskylda gervigreindarkerfa, sem kallast EfficientNets, fari yfir nákvæmni staðlaðra CNN og auki skilvirkni taugakerfis um allt að 10 sinnum.

Nýja taugakerfi Google er mun nákvæmara og hraðvirkara en vinsælar hliðstæður

„Algeng venja að skalastærða líkön er að auka dýpt eða breidd CNN að geðþótta og nota hærri upplausn inntaksmyndarinnar til þjálfunar og mats,“ skrifa hugbúnaðarverkfræðingur starfsmanna Mingxing Tan og Google AI aðalvísindamaður Quoc V .Le). „Ólíkt hefðbundnum aðferðum þar sem færibreytur netkerfis skala að geðþótta eins og breidd, dýpt og inntaksupplausn, mælir aðferðin okkar hverja vídd jafnt og þétt með föstum mælikvarðastuðlum.

Til að bæta árangur enn frekar, mæla vísindamennirnir fyrir því að nota nýtt burðarnet, hreyfanlegur öfugur flöskuhálsmótun (MBConv), sem þjónar sem grundvöllur fyrir EfficientNets módelfjölskylduna.

Í prófunum hefur EfficientNets sýnt fram á bæði meiri nákvæmni og betri skilvirkni en núverandi CNN, sem minnkar stærð færibreytu og kröfur um reiknitilföng um stærðargráðu. Einn af gerðunum, EfficientNet-B7, sýndi 8,4 sinnum minni stærð og 6,1 sinnum betri afköst en hið fræga CNN Gpipe, og náði einnig 84,4% og 97,1% nákvæmni (Top-1 og Top-5). 50 niðurstöður) í prófunum á ImageNet settið. Í samanburði við hið vinsæla CNN ResNet-4, náði annar EfficientNet líkan, EfficientNet-B82,6, sem notar svipaðar auðlindir, nákvæmni upp á 76,3% á móti 50% fyrir ResNet-XNUMX.

EfficientNets líkön stóðu sig vel á öðrum gagnasöfnum, náðu mikilli nákvæmni á fimm af átta viðmiðum, þar á meðal CIFAR-100 gagnapakkanum (91,7% nákvæmni) og Blóm (98,8%).

Nýja taugakerfi Google er mun nákvæmara og hraðvirkara en vinsælar hliðstæður

„Með því að veita verulegar umbætur á skilvirkni taugalíkana, gerum við ráð fyrir að EfficientNets hafi möguleika á að þjóna sem nýr rammi fyrir framtíðarverkefni í tölvusjón,“ skrifa Tan og Li.

Frumkóði og þjálfunarforskriftir fyrir Google Tensor Processing Units (TPU) í skýinu eru ókeypis aðgengilegar á GitHub.



Heimild: 3dnews.ru

Bæta við athugasemd