Lìonraidhean neural. Càit a bheil seo uile a’ dol?

Tha dà phàirt anns an artaigil:

  1. Tuairisgeul goirid air cuid de ailtireachd lìonra airson lorg nithean ann an ìomhaighean agus roinn ìomhaighean leis na ceanglaichean as so-thuigsinn gu goireasan dhòmhsa. Dh'fheuch mi ri mìneachaidhean bhidio a thaghadh agus b'fheàrr ann an Ruisis.
  2. Tha an dàrna pàirt na oidhirp gus tuigse fhaighinn air stiùir leasachadh ailtireachd lìonra neural. Agus teicneòlasan stèidhichte orra.

Lìonraidhean neural. Càit a bheil seo uile a’ dol?

Figear 1 - Chan eil e furasta ailtireachd lìonra neural a thuigsinn

Thòisich seo uile le bhith a’ dèanamh dà thagradh demo airson seòrsachadh agus lorg nithean air fòn Android:

  • Demo cùl-raon, nuair a thèid dàta a phròiseasadh air an fhrithealaiche agus a chuir chun fhòn. Seòrsachadh ìomhaighean de thrì seòrsaichean mathain: donn, dubh agus teadaidh.
  • Demo aghaidh aghaidhnuair a thèid an dàta a phròiseasadh air a’ fòn fhèin. Lorg nithean (lorg nithean) de thrì seòrsaichean: cnothan calltainn, figean agus cinn-latha.

Tha eadar-dhealachadh eadar gnìomhan seòrsachadh ìomhaigh, lorg nithean ann an ìomhaigh agus sgaradh ìomhaigh. Mar sin, bha feum air faighinn a-mach dè na h-ailtirean lìonra neural a bhios a’ lorg nithean ann an ìomhaighean agus dè an fheadhainn as urrainn sgaradh. Lorg mi na h-eisimpleirean a leanas de ailtireachd leis na ceanglaichean as so-thuigsinn gu goireasan dhomh:

  • Sreath de dh'ailtireachd stèidhichte air R-CNN (Rroinnean le Convolution Neural Nfeartan etworks): R-CNN, Fast R-CNN, R-CNN nas luaithe, Masg R-CNN. Gus rud a lorg ann an ìomhaigh, tha bogsaichean crìche air an riarachadh a’ cleachdadh uidheamachd Lìonra Molaidh na Roinne (RPN). An toiseach, chaidh an inneal Rannsachadh Roghnach nas slaodaiche a chleachdadh an àite RPN. An uairsin bidh na roinnean cuibhrichte taghte air am biathadh gu cuir a-steach lìonra neural àbhaisteach airson seòrsachadh. Tha lùban “airson” soilleir aig ailtireachd R-CNN thairis air roinnean cuibhrichte, le suas ri 2000 a’ ruith tro lìonra a-staigh AlexNet. Bidh lùban “airson” soilleir a’ slaodadh astar giollachd ìomhaighean. Bidh an àireamh de lùban soilleir a tha a’ ruith tron ​​​​lìonra neural a-staigh a’ dol sìos le gach dreach ùr den ailtireachd, agus tha dusanan de dh’ atharrachaidhean eile gan dèanamh gus astar àrdachadh agus gus sgaradh stuthan a chuir an àite obair lorg nithean ann am Mask R-CNN.
  • YOLO (You Oculaidh Look Once) a’ chiad lìonra neural a dh’ aithnich nithean ann an àm fìor air innealan gluasadach. Feart sònraichte: eadar-dhealachadh nithean ann an aon ruith (dìreach coimhead aon turas). Is e sin, ann an ailtireachd YOLO chan eil lùban “airson” soilleir ann, agus is e sin as coireach gu bheil an lìonra ag obair gu sgiobalta. Mar eisimpleir, an samhlachas seo: ann an NumPy, nuair a bhios tu a’ dèanamh obair le matrices, chan eil lùban “airson” soilleir ann cuideachd, a tha ann an NumPy air an cur an gnìomh aig ìrean nas ìsle den ailtireachd tro chànan prògramadh C. Bidh YOLO a’ cleachdadh cliath de dh’ uinneagan ro-mhìnichte. Gus casg a chuir air an aon nì a bhith air a mhìneachadh iomadh uair, thathas a’ cleachdadh co-èifeachd tar-tharraing na h-uinneige (IoU). Ieadar-ghearradh oVer Union). Tha an ailtireachd seo ag obrachadh thairis air raon farsaing agus tha àrd neart: Faodar modal a thrèanadh air dealbhan ach tha e fhathast a’ coileanadh gu math air dealbhan air an tarraing le làimh.
  • SSD (Sgroin SMultibox teth Detector) - thathas a’ cleachdadh na “hacks” as soirbheachail de ailtireachd YOLO (mar eisimpleir, casg neo-char as àirde) agus thèid feadhainn ùra a chur ris gus toirt air an lìonra neural obrachadh nas luaithe agus nas cinntiche. Feart sònraichte: a’ comharrachadh nithean ann an aon ruith a’ cleachdadh cliath uinneagan sònraichte (bogsa àbhaisteach) air pioramaid na h-ìomhaigh. Tha pioramaid na h-ìomhaigh air a chòdachadh ann an tensors convolution tro obrachaidhean convolution agus cruinneachadh leantainneach (leis an obair as motha de chruinneachadh, bidh an tomhas spàsail a’ dol sìos). San dòigh seo, tha an dà chuid nithean mòra agus beaga air an suidheachadh ann an aon ruith lìonra.
  • MobileSSD (-làimheNetV2+ SSD) na mheasgachadh de dhà ailtireachd lìonra neural. A ' chiad lìonra MobileNetV2 ag obair gu sgiobalta agus a’ meudachadh cruinneas aithneachaidh. Tha MobileNetV2 air a chleachdadh an àite VGG-16, a chaidh a chleachdadh an toiseach ann an artaigil tùsail. Bidh an dàrna lìonra SSD a’ dearbhadh far a bheil nithean san ìomhaigh.
  • SqueezeNet - lìonra neural glè bheag ach ceart. Leis fhèin, chan eil e a’ fuasgladh na trioblaid lorg nithean. Ach, faodar a chleachdadh ann an cothlamadh de dhiofar ailtireachd. Agus air a chleachdadh ann an innealan gluasadach. Is e am feart sònraichte gu bheil an dàta air a dhlùthadh an toiseach ann an ceithir sìoltachain connspaideach 1 × 1 agus an uairsin air a leudachadh gu ceithir sìoltachain convolutional 1 × 1 agus ceithir 3 × 3. Canar “Modal Teine” ri aon tionndadh den leithid de leudachadh teannachadh dàta.
  • DeepLab (Segmentation Ìomhaigh Semantic le lìn domhainn convolutional) - sgaradh de nithean san ìomhaigh. Is e feart sònraichte den ailtireachd convolution dilated, a tha a’ gleidheadh ​​​​fuasgladh spàsail. Tha seo air a leantainn le ìre iar-ghiollachd de na toraidhean a’ cleachdadh modal probabilistic grafaigeach (raon air thuaiream cumhach), a leigeas leat fuaim beag a thoirt air falbh anns an sgaradh agus càileachd na h-ìomhaigh sgaraichte a leasachadh. Air cùl an ainm iongantach tha “modail probabilistic grafaigeach” a’ falach sìoltachan àbhaisteach Gaussian, a tha air a thomhas le còig puingean.
  • Dh’ fheuch mi ri faighinn a-mach mun inneal MìnichDet (Single-Shot ghrinneachadhment Neural Network for Object eearrann), ach cha do thuig mi mòran.
  • Thug mi sùil cuideachd air mar a tha an teicneòlas “aire” ag obair: bhidio 1, bhidio 2, bhidio 3. Is e feart sònraichte den ailtireachd “aire” an taghadh fèin-ghluasadach de roinnean le barrachd aire san ìomhaigh (RoI, Rlegion of Ininterest) a’ cleachdadh lìonra neural ris an canar Attention Unit. Tha roinnean le barrachd aire coltach ri bogsaichean crìche, ach eu-coltach riutha, chan eil iad stèidhichte san ìomhaigh agus is dòcha gu bheil crìochan doilleir orra. An uairsin, bho roinnean le barrachd aire, tha comharran (feartan) air an dealachadh, a tha “air am biathadh” gu lìonraidhean neural ath-chuairteach le ailtireachd LSDM, GRU no Vanilla RNN. Tha e comasach do lìonraidhean neural ath-chuairteach sgrùdadh a dhèanamh air an dàimh eadar feartan ann an sreath. Chaidh lìonraidhean neural ath-chuairteach a chleachdadh an toiseach gus teacsa eadar-theangachadh gu cànanan eile, agus a-nis airson eadar-theangachadh dealbhan gu teacsa и teacsa gu ìomhaigh.

Mar a bhios sinn a’ sgrùdadh nan ailtireachd sin Thuig mi nach eil mi a 'tuigsinn rud sam bith. Agus chan e gu bheil duilgheadasan aig an lìonra neural agam leis an uidheamachd aire. Tha cruthachadh nan ailtireachd sin uile coltach ri seòrsa de hackathon mòr, far am bi ùghdaran a’ farpais ann an hacks. Tha Hack na fhuasgladh luath air duilgheadas bathar-bog duilich. Is e sin, chan eil ceangal loidsigeach faicsinneach agus so-thuigsinn eadar na h-ailtirean sin uile. Chan eil ann ach an aonachadh seata de na hacks as soirbheachail a gheibh iad air iasad bho chèile, agus fear cumanta dha na h-uile obrachadh iom-fhillte lùb dùinte (mearachd backpropagation, backpropagation). Chan eil smaoineachadh siostaman! Chan eil e soilleir dè a dh’ atharraicheas agus ciamar a nì thu an ìre as fheàrr de choileanaidhean a tha ann mar-thà.

Mar thoradh air an dìth ceangal loidsigeach eadar hacks, tha iad gu math duilich an cuimhneachadh agus an cur an sàs ann an cleachdadh. Is e eòlas sgaoilte a tha seo. Aig a 'char as fheàrr, thathas a' cuimhneachadh air beagan amannan inntinneach agus ris nach robh dùil, ach bidh a 'mhòr-chuid de na tha air a thuigsinn agus do-thuigsinn a' dol à sealladh taobh a-staigh beagan làithean. Bidh e math ma chuimhnicheas tu co-dhiù ainm an ailtireachd ann an seachdain. Ach chaidh grunn uairean a thìde agus eadhon làithean obrach a chaitheamh a’ leughadh artaigilean agus a’ coimhead bhideothan ath-bhreithneachaidh!

Lìonraidhean neural. Càit a bheil seo uile a’ dol?

Figear 2 - Sù de Neural Networks

Bidh a 'mhòr-chuid de ùghdaran artaigilean saidheansail, nam bheachd pearsanta, a' dèanamh a h-uile dad comasach gus dèanamh cinnteach nach eil an leughadair a 'tuigsinn eadhon an eòlas sgapte seo. Ach tha abairtean com-pàirteachail ann an seantansan deich loidhne le foirmlean air an toirt “a-mach à èadhar tana” mar chuspair airson artaigil air leth (duilgheadas foillseachadh no sgrios).

Air an adhbhar seo, tha feum air siostamachadh fiosrachaidh a’ cleachdadh lìonraidhean neural agus, mar sin, àrdachadh càileachd tuigse agus cuimhneachaidh. Mar sin, b ’e am prìomh chuspair mion-sgrùdadh air teicneòlasan fa leth agus ailtireachd lìonraidhean neural fuadain an obair a leanas: faigh a-mach càit a bheil e uile a’ dol, agus chan e inneal lìonra neoral sònraichte sam bith fa leth.

Càit a bheil seo uile a’ dol? Prìomh thoraidhean:

  • An àireamh de thòiseachadh ionnsachadh innealan anns an dà bhliadhna a dh’ fhalbh thuit gu mòr. Adhbhar a dh’ fhaodadh a bhith ann: “chan eil lìonraidhean neural tuilleadh rudeigin ùr.”
  • Faodaidh duine sam bith lìonra neural obrach a chruthachadh gus fuasgladh fhaighinn air duilgheadas sìmplidh. Gus seo a dhèanamh, gabh modal deiseil bhon “model zoo” agus trèanadh an ìre mu dheireadh den lìonra neural (ionnsachadh gluasad) air dàta deiseil bho Rannsachadh Dataset Google no bho 25 mìle dàta Kaggle ann an saor Cloud Jupyter leabhar notaichean.
  • Thòisich luchd-saothrachaidh mòr de lìonraidhean neural a ’cruthachadh "model sùthan" (sùgh modail). Le bhith gan cleachdadh faodaidh tu tagradh malairteach a chruthachadh gu sgiobalta: TF Hub airson TensorFlow, MMD Dearbhadh airson PyTorch, Lorgaire airson cafaidh 2, chainer-modelzoo airson Chainer agus другие.
  • Lìonraidhean neural ag obair ann an fìor-ùine (fìor-ùine) air innealan gluasadach. Bho 10 gu 50 frèamaichean gach diog.
  • Cleachdadh lìonraidhean neural ann am fònaichean (TF Lite), ann am brobhsairean (TF.js) agus ann an stuthan taighe (IoT, Ieadar-lìn of Tlùdagan). Gu sònraichte ann am fònaichean a tha mar-thà a ’toirt taic do lìonraidhean neural aig ìre bathar-cruaidh (luathadairean neural).
  • “Bidh a h-uile inneal, aodach, agus is dòcha eadhon biadh Seòladh IP-v6 agus conaltradh ri chèile" - Sebastian Thrun.
  • Tha an àireamh de fhoillseachaidhean air ionnsachadh innealan air tòiseachadh a’ fàs dol thairis air lagh Moore (dùblachadh a h-uile dà bhliadhna) bho 2015. Gu follaiseach, tha feum againn air lìonraidhean neural airson mion-sgrùdadh air artaigilean.
  • Tha na teicneòlasan a leanas air fàs mòr-chòrdte:
    • PyTorch - tha fèill a’ fàs gu luath agus tha e coltach gu bheil e a’ dol seachad air TensorFlow.
    • Taghadh fèin-ghluasadach de hyperparameters AutoML - tha mòr-chòrdte a’ fàs gu rèidh.
    • Lùghdachadh mean air mhean ann an cruinneas agus àrdachadh ann an astar àireamhachaidh: loidsig fuzzy, algorithms àrdachadh, àireamhachadh neo-mhearachdach (tuairmse), tomhas (nuair a thèid cuideaman an lìonra neural a thionndadh gu àireamhan iomlan agus àireamhach), luathadairean neural.
    • Eadar-theangachadh dealbhan gu teacsa и teacsa gu ìomhaigh.
    • cruthachadh XNUMXD rudan bho bhidio a, a-nis ann an àm fìor.
    • Is e am prìomh rud mu DL gu bheil tòrr dàta ann, ach chan eil e furasta a chruinneachadh agus a chomharrachadh. Mar sin, tha fèin-ghluasad comharrachaidh a’ leasachadh (nota fèin-ghluasadach) airson lìonraidhean neural a’ cleachdadh lìonraidhean neural.
  • Le lìonraidhean neural, thàinig Saidheans Coimpiutaireachd gu h-obann saidheans deuchainneach agus dh'èirich èiginn ath-riochdachadh.
  • Thàinig airgead IT agus mòr-chòrdte lìonraidhean neural am bàrr aig an aon àm nuair a thàinig coimpiutaireachd gu bhith na luach margaidh. Tha an eaconamaidh ag atharrachadh bho eaconamaidh òir is airgid gu òr-airgead-coimpiutaireachd. Faic an artaigil agam air eaconamas agus an t-adhbhar airson coltas airgead IT.

Mean air mhean nochdaidh fear ùr Modh-obrach prògramadh ML/DL (Inneal Ionnsachadh & Ionnsachadh domhainn), a tha stèidhichte air a bhith a’ riochdachadh a’ phrògraim mar sheata de mhodalan lìonra neural trèanaidh.

Lìonraidhean neural. Càit a bheil seo uile a’ dol?

Figear 3 - ML/DL mar dhòigh-obrach prògramaidh ùr

Ach, cha do nochd e a-riamh "teòiridh lìonra neural", anns an urrainn dhut smaoineachadh agus obrachadh gu riaghailteach. Is e an rud ris an canar a-nis “teòiridh” algorithms deuchainneach, heuristic.

Ceanglaichean gu mo chuid fhèin agus goireasan eile:

Спасибо за внимание!

Source: www.habr.com

Cuir beachd ann