Google'дун жаңы нейрон тармагы популярдуу аналогдорго караганда кыйла так жана ылдамыраак

Адамдын көрүү кортексиндеги биологиялык процесстерден шыктанган конволюциялык нейрон тармактары (CNNs) объектти жана бетти таануу сыяктуу тапшырмалар үчүн абдан ылайыктуу, бирок алардын тактыгын жогорулатуу тажатма жана кылдат тууралоону талап кылат. Ошондуктан Google AI изилдөөсүнүн илимпоздору CNNди “көбүрөөк структураланган” жол менен масштабдаган жаңы моделдерди изилдеп жатышат. Алар өз иштеринин жыйынтыгын жарыялашты макала Arxiv.org илимий порталында жарыяланган "EfficientNet: Convolutional нейрон тармактары үчүн моделдин масштабын кайра карап чыгуу", ошондой эле чыгаруу сиздин блогуңузда. Авторлоштор EfficientNets деп аталган жасалма интеллект системаларынын үй-бүлөсү стандарттуу CNN тактыгынан ашып, нейрондук тармактын натыйжалуулугун 10 эсеге чейин жогорулатат деп ырасташат.

Google'дун жаңы нейрон тармагы популярдуу аналогдорго караганда кыйла так жана ылдамыраак

"Моделдерди масштабдоонун кеңири таралган практикасы CNNдин тереңдигин же туурасын өзүм билемдик менен көбөйтүү жана окутуу жана баалоо үчүн киргизилген сүрөттүн жогорку чечкиндүүлүгүн колдонуу", - деп жазат персонал программалык камсыздоо инженери Минксинг Тан жана Google AI жетектөөчү окумуштуусу Quoc V .Le). "Тени, тереңдик жана киргизүү резолюциясы сыяктуу тармактын параметрлерин өзүм билемдик менен масштабдаган салттуу ыкмалардан айырмаланып, биздин метод ар бир өлчөмдү шкалалоо факторлорунун белгиленген топтому менен бир калыпта масштабдайт."

Иштин натыйжалуулугун андан ары жакшыртуу үчүн, изилдөөчүлөр EfficientNets моделдер үй-бүлөсү үчүн негиз болуп кызмат кылган жаңы магистралдык тармакты, мобилдик инверттелген тоскоолдуктарды (MBConv) колдонууну жакташат.

Сыноолордо EfficientNets учурдагы CNNлерге караганда жогорку тактыкты жана жакшыраак эффективдүүлүктү көрсөтүп, параметрдин өлчөмүн жана эсептөө ресурсуна талаптарды чоңдук тартиби менен азайтты. Моделдердин бири, EfficientNet-B7 атактуу CNN Gpipeге караганда 8,4 эсе кичине өлчөмүн жана 6,1 эсе жакшы иштешин көрсөтүп, ошондой эле тестирлөөдө 84,4% жана 97,1% тактыкка (Топ-1 жана Топ-5) жетишти. ImageNet топтому. Популярдуу CNN ResNet-50 менен салыштырганда, EfficientNet-тин дагы бир модели, EfficientNet-B4 окшош ресурстарды колдонуп, ResNet-82,6 үчүн 76,3% га каршы 50% тактыкка жетишкен.

EfficientNets моделдери башка маалымат топтомдорунда жакшы иштеп, сегиз эталондун бешинде жогорку тактыкка жетишти, анын ичинде CIFAR-100 (91,7% тактык) жана Flowers (98,8%).

Google'дун жаңы нейрон тармагы популярдуу аналогдорго караганда кыйла так жана ылдамыраак

"Нейрондук моделдердин натыйжалуулугун олуттуу жакшыртууну камсыз кылуу менен, биз EfficientNets келечектеги компьютердик көрүү милдеттери үчүн жаңы негиз катары кызмат кыла алат деп күтөбүз", - деп жазат Тан жана Ли.

Google'дун булуттагы тензордук иштетүү бирдиктери (TPUs) үчүн булак коду жана окуу скрипттери акысыз жеткиликтүү Github.



Source: 3dnews.ru

Комментарий кошуу