Шабакаҳои нейронӣ. Ин ҳама куҷо меравад?

Мақола аз ду қисм иборат аст:

  1. Тавсифи мухтасари баъзе меъмории шабакавӣ барои ошкор кардани объект дар тасвирҳо ва сегментатсияи тасвирҳо бо истинодҳои фаҳмотарин ба захираҳо барои ман. Ман кӯшиш кардам, ки шарҳҳои видеоиро интихоб кунам ва беҳтараш бо забони русӣ.
  2. Қисми дуюм кӯшиши фаҳмидани самти рушди меъмории шабакаҳои нейрон мебошад. Ва технологияҳо дар асоси онҳо.

Шабакаҳои нейронӣ. Ин ҳама куҷо меравад?

Расми 1 - Фаҳмидани меъмории шабакаи нейрон осон нест

Ҳамааш аз сохтани ду барномаи намоишӣ барои тасниф ва муайянкунии объектҳо дар телефони Android оғоз ёфт:

  • Намоиши ақибмонда, вақте ки маълумот дар сервер коркард ва ба телефон интиқол дода мешавад. Таснифи тасвирҳои се намуди хирсҳо: Браун, сиёҳ ва Тедди.
  • Намоиши пештаравақте ки маълумот дар худи телефон коркард мешавад. Муайян кардани ашё (ошкоркунии ашё) аз се намуд: чормағз, анҷир ва хурмо.

Байни вазифаҳои таснифоти тасвир, муайянкунии объект дар тасвир ва сегментатсияи тасвир. Аз ин рӯ, зарурати муайян кардани он ба миён омад, ки кадом меъмории шабакаи нейронӣ объектҳоро дар тасвирҳо муайян мекунад ва кадоме аз онҳо метавонанд сегментҳоро тақсим кунанд. Ман намунаҳои зерини меъмориро бо истинодҳои фаҳмотарин ба захираҳо барои ман пайдо кардам:

  • Як қатор меъморӣ дар асоси R-CNN (Rминтақаҳо бо Cинволютсия Nевро Nхусусиятҳои etworks): R-CNN, Fast R-CNN, Тезтар R-CNN, Маска R-CNN. Барои муайян кардани объект дар тасвир қуттиҳои маҳдудкунанда бо истифода аз механизми Шабакаи Пешниҳоди минтақавӣ (RPN) ҷудо карда мешаванд. Дар аввал ба ҷои RPN механизми сусттари Ҷустуҷӯи Интихобӣ истифода мешуд. Сипас минтақаҳои маҳдуди интихобшуда барои тасниф ба вуруди шабакаи нейронии анъанавӣ дода мешаванд. Меъмории R-CNN дорои ҳалқаҳои возеҳ "барои" дар минтақаҳои маҳдуд аст, ки дар маҷмӯъ то 2000-ро тавассути шабакаи дохилии AlexNet ташкил медиҳад. Давраҳои равшани "барои" суръати коркарди тасвирро суст мекунанд. Шумораи ҳалқаҳои возеҳе, ки тавассути шабакаи дохилии нейронӣ кор мекунанд, бо ҳар як версияи нави меъморӣ кам мешавад ва даҳҳо тағйироти дигар барои баланд бардоштани суръат ва иваз кардани вазифаи муайянкунии объект бо сегментатсияи объект дар Mask R-CNN ворид карда мешаванд.
  • YOLO (You OСадо Ояндасоз Lиг Once) аввалин шабакаи нейронест, ки объектҳоро дар вақти воқеӣ дар дастгоҳҳои мобилӣ эътироф мекунад. Хусусияти фарқкунанда: фарқ кардани объектҳо дар як давр (танҳо як маротиба нигаред). Яъне дар меъмории YOLO ҳалқаҳои возеҳ "барои" вуҷуд надоранд, аз ин рӯ шабака зуд кор мекунад. Масалан, ин қиёс: дар NumPy ҳангоми иҷрои амалҳо бо матритсаҳо низ ҳалқаҳои возеҳи "for" вуҷуд надоранд, ки дар NumPy дар сатҳҳои поёнии меъморӣ тавассути забони барномасозии Си амалӣ карда мешаванд.YOLO шабакаи тирезаҳои пешакӣ муайяншударо истифода мебарад. Барои пешгирии якчанд маротиба муайян кардани як объект, коэффисиенти такрори тиреза (IoU) истифода мешавад. Iчорроҳа oДод Uнион). Ин меъморӣ дар доираи васеъ фаъолият мекунад ва дорои баланд аст устуворӣ: Моделро метавон бо аксҳо омӯхт, аммо дар расмҳои дастӣ хуб кор мекунад.
  • SSD (Sгӯшмоҳӣ SMultiBox гарм Detektor) - муваффақтарин "хакерҳо" -и меъмории YOLO истифода мешаванд (масалан, ғайримаксимӣ супрессия) ва навҳои нав барои тезтар ва дақиқтар кор кардани шабакаи нейронӣ илова карда мешаванд. Хусусияти фарқкунанда: фарқ кардани объектҳо дар як кор бо истифода аз шабакаи додашудаи тирезаҳо (қуттии пешфарз) дар пирамидаи тасвирҳо. Пирамидаи тасвир дар тензорҳои конволютсия тавассути амалиётҳои пайдарпайи конволютсия ва ҷамъкунӣ рамзгузорӣ карда мешавад (бо амалиёти ҷамъкунии максималӣ андозаи фазоӣ кам мешавад). Бо ин роҳ, ҳам объектҳои калон ва ҳам хурд дар як ҷараёни шабака муайян карда мешаванд.
  • MobileSSD (мобилӣNetV2+ SSD) маҷмӯи ду меъмории шабакаи нейрон аст. Шабакаи аввал MobileNetV2 зуд кор мекунад ва дақиқии шинохти онро зиёд мекунад. MobileNetV2 ба ҷои VGG-16, ки дар ибтидо истифода мешуд, истифода мешавад мақолаи аслӣ. Шабакаи дуюми SSD ҷойгиршавии объектҳоро дар тасвир муайян мекунад.
  • SqueezeNet - як шабакаи хеле хурд, вале дақиқи нейрон. Вай худ аз худ масъалаи ошкор кардани объектро хал намекунад. Бо вуҷуди ин, он метавонад дар якҷоягӣ бо меъмории гуногун истифода шавад. Ва дар дастгоҳҳои мобилӣ истифода мешавад. Хусусияти фарқкунанда дар он аст, ки маълумот аввал ба чаҳор филтри конволютсионӣ 1 × 1 фишурда мешавад ва сипас ба чор филтри конволютсионӣ 1 × 1 ва чор филтри 3 × 3 васеъ карда мешавад. Яке аз чунин такрори фишурдасозии маълумотҳо "Модули оташ" номида мешавад.
  • DeepLab (Semantic Image Semantic Segmentation with Deep Convolutional Nets) – сегментатсияи объектҳо дар тасвир. Хусусияти фарқкунандаи меъморӣ конволютсияи васеъшуда мебошад, ки ҳалли фазоиро нигоҳ медорад. Пас аз он марҳилаи пас аз коркарди натиҷаҳо бо истифода аз модели эҳтимолии графикӣ (майдони тасодуфии шартӣ) сурат мегирад, ки ба шумо имкон медиҳад садои хурдро дар сегментатсия хориҷ кунед ва сифати тасвири сегментшударо беҳтар кунед. Дар паси номи бузурги "модели эҳтимолии графикӣ" филтри муқаррарии Гауссиан пинҳон шудааст, ки бо панҷ нуқта наздик шудааст.
  • Кӯшиш кард, ки дастгоҳро муайян кунад RefineDet (Як тир Тафтиш кунедШабакаи нейронӣ барои объект инection), аммо ман бисёр нафаҳмидам.
  • Ман инчунин ба он нигоҳ кардам, ки технологияи "диққат" чӣ гуна кор мекунад: видео 1, видео 2, видео 3. Хусусияти фарқкунандаи меъмории «диққат» интихоби автоматии минтақаҳои таваҷҷӯҳи зиёд дар тасвир мебошад (RoI, Rлегионхо of Interest) бо истифода аз шабакаи нейронӣ бо номи Attention Unit. Минтақаҳои таваҷҷӯҳи зиёд ба қуттиҳои маҳдудкунанда монанданд, аммо бар хилофи онҳо, онҳо дар тасвир собит нестанд ва метавонанд сарҳадҳои норавшан дошта бошанд. Сипас, аз минтақаҳои таваҷҷӯҳи зиёд, аломатҳо (хусусиятҳо) ҷудо карда мешаванд, ки ба шабакаҳои нейронии такрорӣ бо меъморӣ «таъзо» карда мешаванд. LSDM, GRU ё Vanilla RNN. Шабакаҳои нейронии такрорӣ қодиранд муносибати хусусиятҳоро дар пайдарпай таҳлил кунанд. Шабакаҳои нейронҳои такрорӣ дар аввал барои тарҷумаи матн ба забонҳои дигар истифода мешуданд ва ҳоло барои тарҷума тасвирҳо ба матн и матн ба тасвир.

Вақте ки мо ин меъмориро меомӯзем Ман фаҳмидам, ки ман ҳеҷ чизро намефаҳмам. Ва ин нест, ки шабакаи нейронии ман бо механизми таваҷҷӯҳ мушкилот дорад. Эҷоди ҳамаи ин меъморӣ ба як навъ хакатони бузург монанд аст, ки дар он муаллифон дар ҳакҳо рақобат мекунанд. Hack як ҳалли зуд барои мушкилоти нармафзори мушкил аст. Яъне, дар байни ҳамаи ин меъморӣ робитаи мантиқии намоён ва фаҳмо вуҷуд надорад. Ҳамаи он чизе, ки онҳоро муттаҳид мекунад, маҷмӯи ҳакерҳои муваффақтаринест, ки онҳо аз ҳамдигар қарз мегиранд ва як чизи умумӣ барои ҳама амалиёти конволютсияи пӯшида (ба ақиб паҳншавии хато, баргашт). Не тафаккури системавӣ! Маълум нест, ки чиро тағир додан ва чӣ гуна беҳтар кардани дастовардҳои мавҷуда.

Дар натичаи набудани алокаи мантикии байни хакхо дар хотир нигох доштан ва дар амал татбик намудани онхо нихоят душвор аст. Ин дониши пароканда аст. Бехтарин лахзахои шавковар ва гайричашмдошт ба ёд меоранд, вале бештари он чи фахмо ва нофахмо дар давоми чанд руз аз хотирахо нопадид мешавад. Хуб мешавад, ки пас аз як ҳафта шумо ақаллан номи меъмориро ба ёд оред. Аммо чанд соат ва ҳатто рӯзи корӣ барои хондани мақолаҳо ва тамошои видеоҳои баррасиҳо сарф мешуд!

Шабакаҳои нейронӣ. Ин ҳама куҷо меравад?

Расми 2 - Зоопарки шабакаҳои нейронӣ

Аксари муаллифони маќолањои илмї, ба андешаи шахсии ман, њама кореро мекунанд, ки њатто ин дониши пора-пора аз тарафи хонанда нафањмида шавад. Аммо иборахои иштироккунанда дар дах чумлаи сатр бо формулахое, ки «аз хаво» гирифта шудаанд, мавзуи маколаи алохида мебошанд (мушкилот. нашр ё нобуд).

Аз ин сабаб, зарурати ба низом даровардани иттилоот бо истифода аз шабакаҳои нейрон ва ба ин васила баланд бардоштани сифати фаҳмиш ва хотира ба миён меояд. Аз ин рӯ, мавзӯи асосии таҳлили технологияҳои инфиродӣ ва архитектураи шабакаҳои нейронии сунъӣ вазифаи зерин буд: фаҳмед, ки ҳамааш ба куҷо меравад, ва на дастгоҳи ягон шабакаи нейронии алоҳида.

Ин ҳама куҷо меравад? Натиҷаҳои асосӣ:

  • Шумораи стартапҳои омӯзиши мошинсозӣ дар ду соли охир якбора афтод. Сабаби эҳтимолӣ: "шабакаҳои нейрон дигар чизи нав нестанд."
  • Ҳар як шахс метавонад як шабакаи нейронии корӣ барои ҳалли як масъалаи оддӣ эҷод кунад. Барои ин, аз "зоопарки намунавӣ" модели тайёрро гиред ва қабати охирини шабакаи нейронро омӯзед (омӯзиши интиқол) дар бораи маълумотхои тайёр аз Ҷустуҷӯи маҷмӯи маълумотҳои Google ё аз 25 ҳазор маҷмӯи додаҳои Kaggle дар озод Дафтарчаи абрии Jupyter.
  • Истеҳсолкунандагони бузурги шабакаҳои нейронӣ ба эҷод кардан шурӯъ карданд "ҳайвоноти намунавӣ" (боги намунавии хайвонот). Бо истифода аз онҳо шумо метавонед зуд барномаи тиҷоратӣ эҷод кунед: Маркази TF барои TensorFlow, Муайянкунии MMD барои PyTorch, Детектор барои Caffe2, занчир-моделзоо барои Chainer ва другие.
  • Шабакаҳои нейронӣ кор мекунанд вақти воқеӣ (дар вақти воқеӣ) дар дастгоҳҳои мобилӣ. Аз 10 то 50 кадр дар як сония.
  • Истифодаи шабакаҳои нейронӣ дар телефонҳо (TF Lite), дар браузерҳо (TF.js) ва дар ашёи рӯзгор (IoT, Iинтернет of Tҳалқаҳо). Хусусан дар телефонҳое, ки аллакай шабакаҳои нейронро дар сатҳи сахтафзор дастгирӣ мекунанд (суръатдиҳандаҳои асаб).
  • “Ҳар як дастгоҳ, ашёи либос ва ҳатто шояд ғизо дошта бошад Суроғаи IP-v6 ва бо ҳамдигар муошират кунед" - Себастян Тран.
  • Шумораи нашрияҳо оид ба омӯзиши мошинсозӣ афзоиш ёфт аз қонуни Мур зиёд аст (дар ду сол ду баробар зиёд мешавад) аз соли 2015. Аён аст, ки мо барои таҳлили мақолаҳо ба шабакаҳои нейрон ниёз дорем.
  • Технологияҳои зерин маъруфият пайдо мекунанд:
    • PyTorch - маъруфият босуръат меафзояд ва ба назар мерасад, ки TensorFlow-ро пеш мебарад.
    • Интихоби худкори гиперпараметрҳо AutoML - маъруфият бемайлон меафзояд.
    • Камшавии тадриҷан дақиқ ва баланд бардоштани суръати ҳисоб: мантиқи норавшан, алгоритмҳо баланд бардоштани, хисобхои гай-рики (тахмини), квантизатсия (вазни вазнхои шабакаи нейрон ба ададхои бутун ва квантхо табдил дода мешаванд), суръатбахши асаб.
    • Тарҷума тасвирҳо ба матн и матн ба тасвир.
    • офариниш Объектҳои XNUMXD аз видео, ҳоло дар вақти воқеӣ.
    • Чизи асосии DL дар он аст, ки маълумоти зиёд мавҷуд аст, аммо ҷамъоварӣ ва тамғагузории он осон нест. Аз ин рӯ, автоматизатсияи нишонаҳо инкишоф меёбад (шарҳи автоматӣ) барои шабакаҳои нейрон бо истифода аз шабакаҳои нейрон.
  • Бо шабакаҳои нейронӣ, Илми компютерӣ ногаҳон шуд илми таҷрибавӣ ва бархост бӯҳрони такрорӣ.
  • Пули IT ва маъруфияти шабакаҳои нейрон ҳамзамон вақте пайдо шуданд, ки компютер ба арзиши бозор табдил ёфт. Иқтисод аз иқтисодиёти тилло ва асъор ба иқтисодиёт табдил меёбад тилло-валюта ҳисоббарорӣ. Ба мақолаи ман нигаред эконофизика ва сабаби пайдоиши пулҳои IT.

Оҳиста-оҳиста як нав пайдо мешавад Методологияи барномасозии ML/DL (Machine Learning & Deep Learning), ки ба муаррифии барнома ҳамчун маҷмӯи моделҳои омӯзонидашудаи шабакаи нейронӣ асос ёфтааст.

Шабакаҳои нейронӣ. Ин ҳама куҷо меравад?

Тасвири 3 – ML/DL ҳамчун методологияи нави барномасозӣ

Бо вуҷуди ин, он ҳеҷ гоҳ пайдо нашуд "назарияи шабакаи нейронӣ", ки дар доираи он шумо метавонед мунтазам фикр кунед ва кор кунед. Он чизе, ки ҳоло "назария" номида мешавад, дар асл алгоритмҳои таҷрибавӣ ва эвристикӣ мебошанд.

Истинодҳо ба ман ва дигар захираҳо:

Ташаккур барои таваҷҷӯҳатон!

Манбаъ: will.com

Илова Эзоҳ