Google-ийн шинэ мэдрэлийн сүлжээ нь алдартай аналогиас хамаагүй илүү нарийвчлалтай бөгөөд хурдан юм

Хүний харааны бор гадар дахь биологийн процессоос өдөөгдсөн конволюцийн мэдрэлийн сүлжээ (CNN) нь объект, нүүр царайг таних зэрэг ажлуудад маш тохиромжтой боловч тэдгээрийн нарийвчлалыг сайжруулахын тулд уйтгартай, нарийн тааруулах шаардлагатай байдаг. Тийм ч учраас Google AI Research-ийн эрдэмтэд CNN-ийг "илүү бүтэцтэй" байдлаар "хэмжээнд оруулдаг" шинэ загваруудыг судалж байна. Тэд ажлынхаа үр дүнг нийтэлсэн нийтлэл Шинжлэх ухааны Arxiv.org порталаас зохион байгуулдаг "EfficientNet: Convolutional Neural Networks-ийн загвар масштабыг дахин эргэцүүлэн бодох нь". нийтлэлүүд таны блог дээр. Хамтран зохиогчид EfficientNets хэмээх хиймэл оюун ухааны системүүдийн гэр бүл нь стандарт CNN-ийн нарийвчлалаас давж, мэдрэлийн сүлжээний үр ашгийг 10 дахин нэмэгдүүлдэг гэж мэдэгджээ.

Google-ийн шинэ мэдрэлийн сүлжээ нь алдартай аналогиас хамаагүй илүү нарийвчлалтай бөгөөд хурдан юм

Google AI-ийн ахлах эрдэмтэн, программ хангамжийн инженер Минсин Тан, "Загваруудыг масштабжуулах нийтлэг практик бол CNN-ийн гүн эсвэл өргөнийг дур зоргоороо нэмэгдүүлэх, түүнчлэн сургалт, үнэлгээнд оруулах зургийн өндөр нарийвчлалыг ашиглах явдал юм" гэж бичжээ. Quoc Li (Quoc V .le). "Өргөн, гүн, ирж буй нарийвчлал зэрэг сүлжээний параметрүүдийг дур зоргоороо хэмждэг уламжлалт аргуудаас ялгаатай нь манай арга хэмжээс бүрийг тогтмол масштабын хүчин зүйлээр жигд хэмждэг."

Гүйцэтгэлийг цаашид сайжруулахын тулд судлаачид EfficientNets гэр бүлийн загваруудын үндэс болох хөдөлгөөнт урвуу саад тотгорын эргэлт (MBConv) гэсэн шинэ үндсэн сүлжээг ашиглахыг зөвлөж байна.

Туршилтын үеэр EfficientNets нь одоо байгаа CNN-ээс илүү өндөр нарийвчлалтай, илүү үр ашигтай болохыг харуулсан бөгөөд параметрийн хэмжээ болон тооцооллын нөөцөд тавигдах шаардлагыг хэмжээг дарааллаар нь багасгасан. Загваруудын нэг болох EfficientNet-B7 нь алдартай CNN Gpipe-ээс 8,4 дахин жижиг хэмжээтэй, 6,1 дахин илүү сайн гүйцэтгэлийг харуулсан бөгөөд туршилтын явцад 84,4% ба 97,1% (Топ-1 ба Топ-5 үр дүн) -д хүрсэн. ImageNet багц. Алдартай CNN ResNet-50-тай харьцуулахад ижил төстэй нөөцийг ашигласан EfficientNet-ийн өөр загвар болох EfficientNet-B4 нь ResNet-82,6-ийн хувьд 76,3% -ийн нарийвчлалыг 50% -ийн нарийвчлалтай харуулсан.

EfficientNets загварууд нь бусад өгөгдлийн багц дээр сайн ажиллаж, CIFAR-100 (91,7% нарийвчлал) болон найман туршилтын тавд нь өндөр нарийвчлалтай болсон. Цэцэг (98,8%).

Google-ийн шинэ мэдрэлийн сүлжээ нь алдартай аналогиас хамаагүй илүү нарийвчлалтай бөгөөд хурдан юм

"Мэдрэлийн загваруудын гүйцэтгэлд мэдэгдэхүйц сайжруулалт хийснээр бид EfficientNets нь ирээдүйн компьютерийн харааны сорилтуудад шинэ суурь болж чадна гэж найдаж байна" гэж Тан, Ли бичжээ.

Google Cloud Tensor Processing Units (TPUs)-ийн эх код болон зааварчилгааны скриптийг эндээс үнэгүй авах боломжтой. Github.



Эх сурвалж: 3dnews.ru

сэтгэгдэл нэмэх