🥇Jaringan saraf. Dimana éta sadayana bade

Artikel diwangun ku dua bagian:

Pedaran ringkes sababaraha arsitéktur jaringan pikeun deteksi obyék dina gambar na segmentation gambar kalawan tumbu paling kaharti kana sumberdaya pikeun kuring. Kuring diusahakeun milih katerangan video na preferably dina Rusia.
Bagian kadua mangrupikeun usaha pikeun ngartos arah pangembangan arsitéktur jaringan saraf. Sareng téknologi dumasar kana éta.

Gambar 1 - Ngartos arsitéktur jaringan saraf henteu gampang

Éta sadayana dimimitian ku ngadamel dua aplikasi demo pikeun klasifikasi sareng deteksi obyék dina telepon Android:

Demo tukangeun, lamun data diolah dina server jeung dikirimkeun ka telepon. Klasifikasi gambar tina tilu jinis biruang: coklat, hideung sareng Teddy.
Demo hareup-tungtunglamun data diolah dina telepon sorangan. Deteksi objék (deteksi objék) tina tilu jinis: hazelnuts, anjir sareng kaping.

Aya bédana antara tugas klasifikasi gambar, deteksi objék dina hiji gambar jeung segmentation gambar. Ku alatan éta, aya peryogi pikeun manggihan nu arsitektur jaringan neural ngadeteksi objék dina gambar jeung nu mana nu bisa bagean. Kuring mendakan conto arsitéktur di handap ieu kalayan tautan anu paling kaharti kana sumber pikeun kuring:

Runtuyan arsitéktur dumasar kana R-CNN (Rwewengkon kalawan Convolusi Neural Nfitur etworks): R-CNN, Fast R-CNN, Langkung gancang R-CNN, Topeng R-CNN. Pikeun ngadeteksi hiji obyék dina gambar, kotak wates dialokasikeun ngagunakeun mékanisme Region Proposal Network (RPN). Mimitina, mékanisme Pilarian Selektif anu langkung laun dianggo tibatan RPN. Lajeng wewengkon kawates dipilih nu fed kana input jaringan saraf konvensional pikeun klasifikasi. Arsitéktur R-CNN boga puteran "pikeun" eksplisit di wewengkon kawates, jumlahna nepi ka 2000 ngalir ngaliwatan jaringan internal AlexNet. Eksplisit "pikeun" puteran ngalambatkeun laju ngolah gambar. Jumlah puteran eksplisit ngajalankeun ngaliwatan jaringan neural internal nurun kalawan unggal versi anyar arsitektur, sarta puluhan parobahan séjénna dijieun pikeun ngaronjatkeun kagancangan jeung ngaganti tugas deteksi objék jeung segmentation objék dina Topeng R-CNN.
YOLO (You Only Look Once) nyaéta jaringan saraf munggaran anu mikawanoh objék sacara real waktos dina alat sélulér. Fitur has: ngabedakeun objék dina hiji ngajalankeun (ngan kasampak sakali). Nyaéta, dina arsitéktur YOLO teu aya puteran "pikeun" anu eksplisit, naha éta jaringan tiasa dianggo gancang. Contona, analogi ieu: dina NumPy, nalika ngajalankeun operasi kalawan matrices, aya ogé euweuh eksplisit "pikeun" puteran, nu di NumPy dilaksanakeun dina tingkat handap arsitektur ngaliwatan basa programming C. YOLO ngagunakeun grid tina jandéla tos siap. Pikeun nyegah objék anu sarua ditetepkeun sababaraha kali, dipaké koefisien tumpang tindih jandela (IoU). Iparapatan over Union). arsitéktur ieu ngoperasikeun leuwih rupa-rupa sarta ngabogaan tinggi kateguhan: Hiji model bisa dilatih dina poto tapi tetep kinerja alus dina lukisan leungeun-digambar.
SSD (Sgroin Spanas MultiBox Detector) - "hacks" tersukses tina arsitéktur YOLO dipaké (contona, suprési non-maksimum) jeung nu anyar ditambahkeun sangkan jaringan neural jalan gancang sarta leuwih akurat. Fitur has: ngabédakeun objék dina hiji ngajalankeun ngagunakeun grid tina jandela (kotak standar) dina piramida gambar. Piramida gambar disandikeun dina tensor konvolusi ngaliwatan operasi konvolusi sareng pooling berturut-turut (kalayan operasi max-pooling, dimensi spasial turun). Ku cara kieu, duanana objék badag sarta leutik ditangtukeun dina hiji jaringan jalan.
MobileSSD (MobileNetV2+ SSD) nyaéta gabungan dua arsitéktur jaringan saraf. Jaringan munggaran MobileNetV2 jalan gancang sarta ngaronjatkeun akurasi pangakuan. MobileNetV2 dipaké gaganti VGG-16, nu asalna dipaké dina artikel aslina. Jaringan SSD kadua nangtukeun lokasi objék dina gambar.
SqueezeNet - jaringan saraf anu leutik pisan tapi akurat. Ku sorangan, teu ngajawab masalah deteksi obyék. Nanging, éta tiasa dianggo dina kombinasi arsitéktur anu béda. Sareng dianggo dina alat sélulér. Fitur has nyaéta yén data munggaran dikomprés kana opat 1 × 1 saringan convolutional lajeng dimekarkeun jadi opat 1 × 1 jeung opat 3 × 3 saringan convolutional. Salah sahiji iterasi sapertos ékspansi komprési data disebut "Modul Seuneu".
DeepLab (Segmentation Gambar Semantik kalawan Deep Convolutional Nets) - segmentation objék dina gambar. Fitur has arsitéktur nyaéta konvolusi dilated, anu ngajaga résolusi spasial. Ieu dituturkeun ku tahap pos-processing hasil ngagunakeun modél probabilistik grafis (sawah acak kondisional), nu ngidinan Anjeun pikeun miceun noise leutik dina segmentation jeung ningkatkeun kualitas gambar segmented. Tukangeun ngaran formidable "model probabilistik grafis" nyumputkeun filter Gaussian konvensional, nu diperkirakeun ku lima titik.
Dicobian ngartos alat RefineDet (Tembakan Tunggal nyaringNeural Network pikeun Objék etaection), tapi kuring henteu ngartos pisan.
Kuring ogé ningali kumaha téknologi "perhatian" jalanna: video1, video2, video3. Fitur has tina arsitéktur "perhatian" nyaéta pilihan otomatis daérah anu ningkat perhatian dina gambar (RoI, Rlegiun of Ikapentingan) ngagunakeun jaringan saraf disebut Attention Unit. Wewengkon anu ningkat perhatian sami sareng kotak wates, tapi teu siga aranjeunna, aranjeunna henteu tetep dina gambar sareng mungkin gaduh wates kabur. Teras, ti daérah anu ningkat perhatian, tanda-tanda (fitur) diisolasi, anu "disusun" ka jaringan neural anu ngulang sareng arsitéktur. LSDM, GRU atanapi Vanili RNN. Jaringan saraf recurrent tiasa nganalisis hubungan fitur dina urutan. Jaringan saraf recurrent mimitina dipaké pikeun narjamahkeun téks kana basa séjén, sarta ayeuna keur tarjamah gambar kana téks и téks kana gambar.

Nalika urang ngajalajah arsitéktur ieu Kuring sadar yén kuring teu ngarti nanaon. Sareng sanés yén jaringan saraf kuring ngagaduhan masalah sareng mékanisme perhatian. Nyiptakeun sadaya arsitéktur ieu sapertos sababaraha jinis hackathon anu ageung, dimana pangarang bersaing dina hacks. Hack mangrupikeun solusi gancang pikeun masalah parangkat lunak anu sesah. Nyaéta, teu aya hubungan logis anu katingali sareng kaharti antara sadaya arsitéktur ieu. Sadaya anu ngahijikeun aranjeunna mangrupikeun sakumpulan hacks anu paling suksés anu aranjeunna diinjeum ti silih, ditambah anu umum pikeun sadayana. operasi konvolusi loop tertutup (error backpropagation, backpropagation). No sistem pamikiran! Henteu écés naon anu kedah dirobih sareng kumaha ngaoptimalkeun prestasi anu tos aya.

Salaku hasil tina kurangna sambungan logis antara hacks, aranjeunna hésé pisan diinget tur nerapkeun dina prakna. Ieu pangaweruh fragmented. Di pangalusna, sababaraha moments metot jeung teu kaduga inget, tapi lolobana naon anu dipikaharti sarta kaharti leungit tina memori dina sababaraha poé. Hadé pisan upami dina saminggu anjeun émut sahenteuna nami arsitéktur. Tapi sababaraha jam bahkan dinten-dinten waktos damel diséépkeun pikeun maca tulisan sareng ningali pidéo ulasan!

Gambar 2 – Kebon Binatang tina Neural Networks

Kalolobaan pangarang artikel ilmiah, dina pamadegan pribadi abdi, ngalakukeun sagalana mungkin pikeun mastikeun yén sanajan pangaweruh fragmented ieu teu dipikaharti ku nu maca. Tapi frase participial dina kalimat sapuluh baris kalayan rumus anu dicandak "kaluar tina hawa ipis" mangrupakeun topik pikeun artikel misah (masalah nyebarkeun atanapi binasa).

Ku sabab kitu, aya kabutuhan pikeun sistematis inpormasi nganggo jaringan saraf sareng, ku kituna, ningkatkeun kualitas pamahaman sareng pangémutan. Ku alatan éta, topik utama analisa téknologi individu sareng arsitéktur jaringan saraf jieunan nyaéta tugas di handap ieu: Panggihan kamana éta sadayana, sareng sanés alat tina jaringan saraf khusus anu nyalira.

Dimana sadayana ieu nuju? Hasil utama:

Jumlah ngamimitian machine learning dina dua taun ka tukang murag seukeut. Alesan anu mungkin: "jaringan saraf henteu deui anu énggal."
Saha waé tiasa nyiptakeun jaringan saraf anu tiasa dianggo pikeun ngabéréskeun masalah anu sederhana. Jang ngalampahkeun ieu, cokot modél anu siap-siap tina "model kebon binatang" sareng ngalatih lapisan terakhir jaringan saraf (mindahkeun diajar) dina data siap-dijieun tina Pilarian Dataset Google atanapi ti 25 rébu Kaggle datasets di bébas awan Jupyter Notebook.
Pabrikan ageung jaringan neural mimiti nyiptakeun "model kebon binatang" (model kebon binatang). Ngagunakeun eta anjeun bisa gancang nyieun aplikasi komérsial: TF Hub pikeun TensorFlow, MMDeteksi pikeun PyTorch, Detéktron pikeun Caffe2, chainer-modelzoo pikeun Chainer jeung другие.
Jaringan saraf dianggo dina langsung (real-time) dina alat sélulér. Ti 10 nepi ka 50 pigura per detik.
Pamakéan jaringan saraf dina telepon (TF Lite), dina browser (TF.js) sareng dina barang-barang rumah tangga (IoT, Iinternét of Tengsel). Utamana dina telepon anu parantos ngadukung jaringan saraf dina tingkat hardware (akselerator saraf).
"Unggal alat, barang papakéan, sareng panginten tuangeun bakal aya Alamat IP-v6 sareng saling komunikasi"- Sebastian Thrun.
Jumlah publikasi ngeunaan pembelajaran mesin parantos ningkat ngaleuwihan hukum Moore urang (dua kali unggal dua taun) saprak 2015. Jelas, urang peryogi jaringan saraf pikeun nganalisis artikel.
Téknologi di handap ieu beuki populer:
- PyTorch - popularitas ngembang pesat jeung sigana overtaking TensorFlow.
- Pilihan otomatis tina hyperparameters AutoML - popularitas tumuwuh lancar.
- Panurunan bertahap dina akurasi sareng paningkatan laju itungan: logika fuzzy, algoritma naekeun, itungan teu akurat (perkiraan), kuantisasi (lamun beurat jaringan saraf dirobih kana wilangan bulat sareng dikuantisasi), akselerator saraf.
- Tarjamahan gambar kana téks и téks kana gambar.
- ciptaan objék XNUMXD tina video, ayeuna sacara real waktos.
- Hal utama ngeunaan DL nyaeta aya loba data, tapi ngumpulkeun sarta panyiri teu gampang. Ku alatan éta, otomatisasi markup ngembang (annotation otomatis) pikeun jaringan saraf ngagunakeun jaringan saraf.
Kalayan jaringan saraf, Ilmu Komputer ujug-ujug janten élmu ékspérimén sarta jengkar krisis reproducibility.
Duit IT sareng popularitas jaringan saraf muncul sakaligus nalika komputasi janten nilai pasar. Ékonomi ieu ngarobah tina ékonomi emas jeung mata uang pikeun emas-mata uang-komputasi. Tempo artikel abdi on ékonofisika jeung alesan pikeun penampilan duit IT.

Saeutik demi saeutik muncul nu anyar Métodologi programming ML/DL (Machine Learning & Deep Learning), anu dumasar kana ngagambarkeun program salaku sakumpulan modél jaringan saraf anu dilatih.

Gambar 3 - ML / DL salaku metodologi programming anyar

Sanajan kitu, eta pernah mucunghul "teori jaringan saraf", dimana anjeun tiasa mikir sareng damel sacara sistematis. Naon anu ayeuna disebut "téori" sabenerna ékspérimén, algoritma heuristik.

Tumbu ka abdi sareng sumber sejenna:

Newsletter Élmu Data. Utamana ngolah gambar. Saha waé anu badé nampi kedah ngirim email (foobar167<gaf-gaf>gmail<dot>com). Kuring ngirim kaluar Tumbu ka artikel sareng video salaku accumulates bahan.
Umum daptar kursus jeung artikelnu geus kaliwat jeung nu kuring hayang lulus.
Kursus sareng pidéo pikeun pamula, dimana anjeun kedah ngamimitian diajar jaringan saraf. Ditambah brosur "Pendahuluan Pembelajaran Mesin sareng Jaringan Syaraf Tiruan".
Pakakas Mangpaat, dimana dulur bakal manggihan hal metot pikeun diri.
Kami mendakan aranjeunna mangpaat pisan. saluran video pikeun analisis artikel ilmiah ku Élmu Data. Milarian, ngalanggan aranjeunna sareng teraskeun tautan ka kolega anjeun sareng kuring ogé. conto:
- Dua Makalah Menit
- Henry AI Labs
- Yannic Kilcher
- CodeEmporium
- Blog Chengwei Zhang aka Tony607 kalawan parentah hambalan-demi-hambalan jeung open source.

Hatur nuhun kanggo nengetan!

sumber: www.habr.com

Jaringan saraf. Kamana ieu sadayana?

Tambahkeun komentar ngabolaykeun reply