Faʻaaogaina AI e faʻamalo ai ata

Faʻaaogaina AI e faʻamalo ai ata
Algoritm e fa'atatau i fa'amaumauga e pei o feso'ota'iga neural ua a'afia ai le lalolagi i afā. O la latou atinaʻe e faʻamalosia e le tele o mafuaʻaga, e aofia ai mea taugofie ma mamana ma le tele o faʻamaumauga. Neural networks o loʻo i luma o mea uma e fesoʻotaʻi ma galuega "mafaufau" e pei o le iloa o ata, malamalama i le gagana masani, ma isi. Ae e le tatau ona faatapulaaina i na galuega. O lenei mea o loʻo faʻamatalaina ai se auala mo le faʻapipiʻiina o ata e faʻaaoga ai neural networks e faʻaaoga ai aʻoaʻoga totoe. O le auala o loʻo tuʻuina atu i le tusiga e galue vave ma sili atu nai lo codec masani. Fuafuaga, fa'atusa ma, ioe, o se laulau ma su'ega i lalo o le tipi.

O lenei tusiga e faʻavae i luga lenei galuega. E fa'apea ua e masani i neural networks ma latou manatu fa'alavelave и galuega leiloa.

O le a le compression o ata ma o a ituaiga e sau i totonu?

O le fa'apipi'iina o ata o le fa'agasologa lea o le suia o se ata ina ia fa'aitiitia ai le avanoa. Na'o le teuina o ata o le a alu ai le tele o avanoa, o lea e iai codecs pei o le JPEG ma le PNG e fa'amoemoe e fa'aitiitia le tele o le ata muamua.

E pei ona e iloa, e lua ituaiga o faʻamalosi ata: leai se gau и ma gau. E pei ona ta'u mai e igoa, e mafai ona toe maua e le compression le fa'aletonu le fa'amaumauga o ata muamua, a'o le fa'amalosi fa'aletonu e leiloa nisi fa'amatalaga i le taimi o le fa'amalosi. mo se faʻataʻitaʻiga, JPG o algorithms leiloa [approx. fa'aliliuga - o le mea moni, aua nei galo ia i tatou e uiga i le leai o se JPEG], ma PNG o se algorithm leai se leiloa.

Faʻaaogaina AI e faʻamalo ai ata
Fa'atusatusaga o le fa'amaumau e leai se gau ma le gau

Manatua o le ata i le itu taumatau o loʻo i ai le tele o mea poloka poloka. Ua leiloa lenei faamatalaga. O pika lata ane o lanu tutusa o lo'o fa'apipi'iina e pei o se tasi vaega e fa'asaoina avanoa, ae o fa'amatalaga e uiga i pika moni ua leiloa. Ioe, o algorithms o loʻo faʻaaogaina i le JPEG, PNG, ma isi codecs e sili atu ona faigata, ae o se faʻataʻitaʻiga lelei lea o le gau o le faʻamalosi. E lelei le fa'amateina e leai se gau, ae o faila fa'amaumau e leai se gau e alu ai le tele o avanoa tisiki. E i ai auala sili atu ona lelei e faʻapipiʻi ai ata e aunoa ma le leiloa o le tele o faʻamatalaga, ae e fai si telegese ma tele faʻaogaina auala faʻasolosolo. O lona uiga e le mafai ona fa'atutusa i luga ole tele ole CPU po'o le GPU. O lenei tapula'a ua matua le mafai ai ona fa'aoga i aso uma.

Convolutional Neural Network Input

Afai e iai se mea e manaʻomia ona faʻatatauina ma o faʻatusatusaga atonu e faʻatatau, faʻaopoopo feso'ota'iga neural. Na faʻaogaina e le au tusitala se fesoʻotaʻiga neural convolutional masani e faʻaleleia ai le faʻapipiʻiina o ata. O le auala o lo'o tu'uina atu e le gata ina fa'atino fa'atasi ma fofo sili (pe a le sili atu), e mafai fo'i ona fa'aogaina fa'atusatusaga fa'akomupiuta, ma fa'atupuina ai se fa'atuputeleina tele o le saoasaoa. O le mafuaʻaga ona o fesoʻotaʻiga neural convolutional (CNNs) e lelei tele i le suʻeina o faʻamatalaga faʻafanua mai ata, ona faʻaalia lea i se foliga sili atu (mo se faʻataʻitaʻiga, naʻo vaega "taua" o le ata o loʻo taofia). Na manaʻo le au tusitala e faʻaoga lenei vaega o le CNN e faʻaalia atili ai ata.

atiga

Na fautuaina e le au tusitala se fesoʻotaʻiga lua. Ole feso'ota'iga muamua e ave se ata e fai ma fa'aoga ma fa'atupuina se fa'atusa fa'atusatusa (ComCNN). O le gaosiga o lenei fesoʻotaʻiga e faʻatautaia e se codec masani (pei o le JPEG). A maeʻa ona faʻatautaia e le codec, e auina atu le ata i se fesoʻotaʻiga lona lua, lea e "faʻasaʻo" le ata mai le codec i se taumafaiga e toe faʻafoʻi le ata muamua. Na taʻua e tusitala lenei fesoʻotaʻiga o le toe fausia CNN (RecCNN). E pei o GAN, o fesoʻotaʻiga uma e lua e aʻoaʻoina faʻasolosolo.

Faʻaaogaina AI e faʻamalo ai ata
ComCNN Fa'atusa fa'atusa ua tu'uina atu ile codec masani

Faʻaaogaina AI e faʻamalo ai ata
RecCNN. O le ComCNN output ua faʻaleleia ma fafaga i RecCNN, lea o le a taumafai e aʻoaʻo le vaega o totoe

Ua fa'asili i luga le fa'ailoga codec ona fafaga lea i le RecCNN. RecCNN o le a taumafai e faʻaalia se ata e tutusa ma le ata muamua e mafai.

Faʻaaogaina AI e faʻamalo ai ata
Auivi fa'apipi'i ata i le pito. Co(.) o se ata fa'apipi'i algorithm. Na faʻaaogaina e tusitala JPEG, JPEG2000 ma BPG

O le a le mea o totoe?

O le vaega o totoe e mafai ona mafaufauina o se laasaga mulimuli e "faʻaleleia" le ata o loʻo faʻavasegaina e le codec. Faatasi ai ma le tele o "faʻamatalaga" e uiga i le lalolagi, e mafai e se neural network ona faia filifiliga mafaufau e uiga i mea e faʻaleleia. O lenei manatu e faavae i luga toega toleniga, faitau fa'amatalaga e te mafaia iinei.

Galuega leiloa

E lua galuega leiloa e faʻaaogaina ona e lua a matou neural networks. O le muamua o nei mea, ComCNN, ua faʻaigoaina L1 ma faʻamatalaina e faapea:

Faʻaaogaina AI e faʻamalo ai ata
Galuega gau mo ComCNN

Faamalamalamaga

O lenei fa'atusatusaga e ono foliga faigata, ae o le mea moni lava (o lona uiga o mea sese fa'afafa) MSE. ||² o lona uiga o le masani o le vete latou te faʻapipiʻiina.

Faʻaaogaina AI e faʻamalo ai ata
Fa'atusa 1.1

O le Cr o loʻo faʻaalia ai le gaosiga o le ComCNN. θ o loʻo faʻaalia ai le aʻoaʻoina o laina ComCNN, XK o le ata faʻaoga

Faʻaaogaina AI e faʻamalo ai ata
Fa'atusa 1.2

Re() e tu mo RecCNN. O lenei fa'atusa na'o le pasi atu o le tau o le fa'atusa 1.1 i le RecCNN. θ o loʻo faʻaalia ai taʻiala e mafai ona aʻoaʻoina o RecCNN (o le pulou i luga o lona uiga e faʻamautu faʻamau).

Fa'amatalaga malamalama

Fa'atusa 1.0 o le a fa'amalosia ai le ComCNN e sui ona mamafa ina ia, pe a toe fa'aaogaina le RecCNN, o le ata mulimuli e foliga tutusa ma le ata fa'aoga pe a mafai. O le galuega lona lua o le leiloa o le RecCNN o loʻo faʻamatalaina e faapea:

Faʻaaogaina AI e faʻamalo ai ata
Fa'atusa 2.0

Faamalamalamaga

Atonu e foliga faigata le galuega, ae mo le tele o vaega o se galuega faʻaletonu neural network (MSE).

Faʻaaogaina AI e faʻamalo ai ata
Fa'atusa 2.1

Co() o lona uiga o le codec output, x ma le pulou i luga o lona uiga ComCNN output. θ2 o taʻiala e mafai ona aʻoaʻoina o RecCNN, res() ua na'o le vaega totoe o le RecCNN. E taua le matauina o le RecCNN ua aʻoaʻoina i le eseesega i le va o Co() ma le ata faʻapipiʻi, ae le o luga ole ata faʻaoga.

Fa'amatalaga malamalama

Fa'atusa 2.0 o le a fa'amalosia RecCNN e sui ona mamafa ina ia foliga tutusa le gaioiga ma le ata fa'aoga pe a mafai.

Polokalame a'oa'oga

O faʻataʻitaʻiga e aʻoaʻoina faʻasolosolo, tutusa ma GAN. O le fa'ata'ita'iga muamua e fa'amautu a'o fa'afou le fa'ata'ita'iga lona lua, ona fa'amautu lea o le fa'ata'ita'iga lona lua a'o a'oa'oina le fa'ata'ita'iga muamua.

Tests

Na faʻatusatusa e le au tusitala a latou metotia ma metotia o loʻo i ai, e aofia ai codecs faigofie. O la latou metotia e sili atu le aoga nai lo isi aʻo faʻaauau pea le saoasaoa i luga o meafaigaluega talafeagai. E le gata i lea, na taumafai le au tusitala e faʻaaoga naʻo le tasi o fesoʻotaʻiga e lua ma maitauina le pa'ū i le faʻatinoga.

Faʻaaogaina AI e faʻamalo ai ata
Fa'atusa fa'atusa fa'atusa (SSIM). O tau maualuga e faʻaalia ai le tutusa lelei ma le mea muamua. O taunuʻuga o galuega a le au tusitala o loʻo faʻamaonia i le mataʻutia.

iʻuga

Na matou vaʻavaʻai i se auala fou e faʻaaoga ai aʻoaʻoga loloto mo le faʻapipiʻiina o ata, ma talanoa e uiga i le avanoa e faʻaogaina ai fesoʻotaʻiga neural i galuega i tua atu o "lautele", e pei o le faʻavasegaina o ata ma le faʻaogaina o le gagana. O lenei metotia e le gata e le maualalo i manaʻoga faʻaonaponei, ae faʻatagaina foi oe e faʻagasolo vave ata.

Ua sili atu ona faigofie le suʻesuʻeina o fesoʻotaʻiga neural, aua ua matou fatuina se faʻailoga faʻalauiloa aemaise lava mo tagata o Khabra HABR, tuʻuina atu se faʻaopoopoga 10% faʻaitiitiga i le faʻaitiitiga o loʻo faʻaalia i luga o le fuʻa.

Faʻaaogaina AI e faʻamalo ai ata

Tele kosi

Mataupu Fa'apitoa

puna: www.habr.com

Faaopoopo i ai se faamatalaga