Ke hoʻohana nei iā AI e hoʻopā i nā kiʻi

Ke hoʻohana nei iā AI e hoʻopā i nā kiʻi
ʻO nā algorithms i hoʻokele ʻia e ka ʻikepili e like me nā neural network i lawe i ka honua ma ka ʻino. ʻO kā lākou hoʻomohala ʻana ma muli o nā kumu he nui, ʻo ia hoʻi nā mea hana maʻalahi a ikaika a me ka nui o ka ʻikepili. Aia nā pūnaewele neural i kēia manawa ma mua o nā mea a pau e pili ana i nā hana "cognitive" e like me ka ʻike kiʻi, ka ʻike ʻōlelo kūlohelohe, etc. Akā ʻaʻole pono lākou e kaupalena ʻia i ia mau hana. Ke kamaʻilio nei kēia ʻatikala e pili ana i ka hoʻopili ʻana i nā kiʻi me ka hoʻohana ʻana i nā neural network, me ka hoʻohana ʻana i ke koena aʻo. ʻOi aku ka wikiwiki a ʻoi aku ka maikaʻi o ke ala i hōʻike ʻia ma ka ʻatikala ma mua o nā codec maʻamau. Schemes, equations a, ʻoiaʻiʻo, he papa me nā hoʻāʻo ma lalo o ka ʻoki.

Hoʻokumu ʻia kēia ʻatikala ma kēia hana. Manaʻo ʻia ua kamaʻāina ʻoe i nā neural network a me kā lākou mau manaʻo. huikau и hana poho.

He aha ka hoʻopili kiʻi a pehea e hana ai?

ʻO ka hoʻoemi kiʻi ke kaʻina hana o ka hoʻololi ʻana i kahi kiʻi i mea e liʻiliʻi ai ka nui. ʻO ka mālama wale ʻana i nā kiʻi e lawe i kahi nui, ʻo ia ke kumu i loaʻa ai nā codecs e like me JPEG a me PNG e manaʻo nei e hōʻemi i ka nui o ke kiʻi kumu.

E like me kāu e ʻike ai, ʻelua ʻano o ke kaomi kiʻi: ʻaʻohe poho и me na poho. E like me ka hōʻike ʻana o nā inoa, hiki ke hoʻopaʻa ʻia ka compression lossless i ka ʻikepili kiʻi kumu, aʻo ka compression lossy e nalowale kekahi mau ʻikepili i ka wā o ke kōmi ʻana. no ka laʻana, ʻo JPG nā algorithms lossy [approx. unuhi. - ma ke ano, mai poina kakou e pili ana i ka lossless JPEG], a me PNG kahi algorithm lossless.

Ke hoʻohana nei iā AI e hoʻopā i nā kiʻi
Hoʻohālikelike i ka hoʻoemi ʻole a me ka poho

E nānā i ka nui o nā mea hana blocky ma ke kiʻi ma ka ʻākau. Ua nalowale kēia ʻike. Hoʻopili ʻia nā pika pili o nā waihoʻoluʻu like i kahi wahi e mālama ai i ka lewa, akā nalowale ka ʻike e pili ana i nā pika maoli. ʻOiaʻiʻo, ʻoi aku ka paʻakikī o nā algorithms i hoʻohana ʻia ma ka JPEG, PNG, etc. codecs, akā he hiʻohiʻona intuitive maikaʻi kēia o ka hoʻopiʻi lossy. Maikaʻi ka hoʻoemi ʻole ʻana, akā ʻo nā faila i hoʻopaʻa ʻole ʻia e lawe i ka nui o nā wahi disk. Aia nā ala maikaʻi aʻe e hoʻopaʻa i nā kiʻi me ka nalowale ʻole o ka ʻike, akā lohi lākou a hoʻohana nui i nā ala iterative. ʻO kēia ke ʻano ʻaʻole hiki iā lākou ke holo like ma luna o nā cores CPU a i ʻole GPU. ʻO kēia palena ka mea i hiki ʻole iā lākou ke hoʻohana i kēlā me kēia lā.

Hoʻokomo ʻia ʻo Convolutional Neural Network

Inā pono e helu ʻia kekahi mea a hiki ke hoʻohālikelike ʻia nā helu, hoʻohui pūnaewele neural. Ua hoʻohana nā mea kākau i kahi pūnaewele neural convolutional maʻamau e hoʻomaikaʻi i ka hoʻopili kiʻi. ʻAʻole hana wale ke ʻano i hōʻike ʻia ma ka par me nā hopena maikaʻi loa (inā ʻaʻole ʻoi aku ka maikaʻi), hiki nō ke hoʻohana i ka computing parallel, e alakaʻi ana i ka piʻi nui o ka wikiwiki. ʻO ke kumu, he maikaʻi loa nā Convolutional Neural Networks (CNNs) i ka unuhi ʻana i ka ʻike kikoʻī mai nā kiʻi, a laila hōʻike ʻia ma kahi ʻano paʻakikī (no ka laʻana, mālama ʻia nā ʻāpana "koʻikoʻi" o ke kiʻi). Ua makemake nā mea kākau e hoʻohana i kēia hiki iā CNN e hōʻike maikaʻi i nā kiʻi.

kuhikuhipuʻuone

Ua manaʻo nā mea kākau i kahi pūnaewele pālua. Lawe ka pūnaewele mua i kahi kiʻi ma ke ʻano he hoʻokomo a hana i kahi hōʻike paʻa (ComCNN). Hoʻohana ʻia ka hoʻopuka ʻana o kēia pūnaewele e kahi codec maʻamau (e like me JPEG). Ma hope o ka hoʻoponopono ʻia ʻana e ka codec, ua hāʻawi ʻia ke kiʻi i kahi pūnaewele lua, e "hoʻoponopono" i ke kiʻi mai ka codec i ka hoʻāʻo e hoʻihoʻi i ke kiʻi kumu. Ua kapa nā mea kākau i kēia pūnaewele Reconstructive CNN (RecCNN). E like me nā GAN, ua aʻo ʻia nā pūnaewele ʻelua.

Ke hoʻohana nei iā AI e hoʻopā i nā kiʻi
Hāʻawi ʻia ka hōʻike ComCNN Compact i ka codec maʻamau

Ke hoʻohana nei iā AI e hoʻopā i nā kiʻi
RecCNN. Hoʻonui ʻia ka hoʻopuka ComCNN a hāʻawi ʻia iā RecCNN, nāna e hoʻāʻo e aʻo i ke koena

Hoʻonui ʻia ka huahana codec a laila hāʻawi ʻia iā RecCNN. E ho'āʻo ʻo RecCNN e hoʻolilo i ke kiʻi i kahi kokoke i ke kiʻi kumu.

Ke hoʻohana nei iā AI e hoʻopā i nā kiʻi
Ka hoʻoemi kiʻi hope-a-hope. ʻO Co(.) kahi algorithm kaomi kiʻi. Ua hoʻohana nā mea kākau iā JPEG, JPEG2000 a me BPG

He aha ke koena?

Hiki ke noʻonoʻo ʻia ke koena ma ke ʻano he kaʻina hana hope e "hoʻomaikaʻi" i ke kiʻi i hoʻokaʻawale ʻia e ke codec. Loaʻa ka nui o ka "ʻike" e pili ana i ka honua, hiki i kahi neural network ke hana i nā hoʻoholo cognitive e pili ana i ka mea e hoʻoponopono ai. Hoʻokumu ʻia kēia manaʻo ma luna o aʻo koena, e heluhelu i nā kikoʻī e pili ana iā ʻoe maanei.

Nā hana poho

Hoʻohana ʻia nā hana poho ʻelua no ka mea he ʻelua mau neural network mākou. ʻO ka mua o kēia, ComCNN, ua kapa ʻia ʻo L1 a ua wehewehe ʻia penei:

Ke hoʻohana nei iā AI e hoʻopā i nā kiʻi
Hana poho no ComCNN

ʻO ka wehewehe

Me he mea paʻakikī paha kēia hoohalike, akā ʻo ia ka mea maʻamau (ke kumu mean square error) MSE. ||² ʻo ia ka mea maʻamau o ka vector a lākou i hoʻopili ai.

Ke hoʻohana nei iā AI e hoʻopā i nā kiʻi
Hoʻohālike 1.1

Hōʻike ka Cr i ka puka o ComCNN. θ hōʻike i ke aʻo ʻana o nā ʻāpana ComCNN, ʻo XK ke kiʻi hoʻokomo

Ke hoʻohana nei iā AI e hoʻopā i nā kiʻi
Hoʻohālike 1.2

Re() kū no RecCNN. Hāʻawi wale kēia hoohalike i ke ʻano o ka hoohalike 1.1 i RecCNN. Hōʻike ka θ i nā ʻāpana hoʻomaʻamaʻa RecCNN (ʻo ka pāpale ma luna ʻo ia ka paʻa o nā ʻāpana).

Wehewehe ʻike

E hoʻololi ka hoʻohālikelike 1.0 i ka ComCNN i kāna mau kaupaona a i ka wā i hana hou ʻia me RecCNN, ʻano like ke kiʻi hope me ke kiʻi hoʻokomo. Ua wehewehe ʻia ka lua o ka hana poho RecCNN penei:

Ke hoʻohana nei iā AI e hoʻopā i nā kiʻi
Hoʻohālike 2.0

ʻO ka wehewehe

Eia hou, paʻakikī paha ka hana, akā ʻo kēia ka hapa nui o ka hana neural network loss (MSE).

Ke hoʻohana nei iā AI e hoʻopā i nā kiʻi
Hoʻohālike 2.1

Co() 'o ia ho'i ka ho'opuka codec, x me ka pāpale ma luna 'o ia ho'i ka ho'opuka ComCNN. ʻO θ2 nā ʻāpana hoʻonaʻauao RecCNN, res() ʻo ia wale nō ke koena o RecCNN. Pono e hoʻomaopopo ʻia ua aʻo ʻia ʻo RecCNN ma ka ʻokoʻa ma waena o Co() a me ke kiʻi hoʻokomo, akā ʻaʻole ma ke kiʻi hoʻokomo.

Wehewehe ʻike

E hoʻololi ka hoʻohālikelike 2.0 i ka RecCNN i kona mau kaupaona i mea e like ai ka hopena me ke kiʻi hoʻokomo.

Papahana aʻo

Hoʻomaʻamaʻa ʻia nā ʻano hoʻohālike, e like me GAN. Hoʻopaʻa ʻia nā paona o ke kumu hoʻohālike mua i ka wā e hoʻonui ʻia ana nā paona o ke kumu hoʻohālike ʻelua, a laila hoʻopaʻa ʻia nā paona o ke kumu hoʻohālike ʻelua i ka wā e aʻo ʻia ana ke kumu hoʻohālike mua.

Nā ho'āʻo

Ua hoʻohālikelike nā mea kākau i kā lākou ʻano me nā ala e kū nei, me nā codec maʻalahi. ʻOi aku ka maikaʻi o kā lākou ʻano hana ma mua o nā mea ʻē aʻe me ka mālama ʻana i ka wikiwiki kiʻekiʻe ma ka hāmeʻa kūpono. Eia kekahi, ua ho'āʻo nā mea kākau e hoʻohana i hoʻokahi wale nō o nā pūnaewele ʻelua a ʻike i kahi hāʻule o ka hana.

Ke hoʻohana nei iā AI e hoʻopā i nā kiʻi
Hoʻohālikelike Hoʻohālikelike Kūlike Kūlike (SSIM). Hōʻike nā waiwai kiʻekiʻe i kahi like maikaʻi aʻe i ka mea kumu. Hōʻike ke ʻano wiwo ʻole i ka hopena o ka hana a nā mea kākau

hopena

Ua nānā mākou i kahi ala hou e hoʻopili ai i ke aʻo hohonu i ka paʻi kiʻi, a kamaʻilio e pili ana i ka hiki ke hoʻohana i nā neural network i nā hana ma mua o nā hana "nui" e like me ka hoʻokaʻawale kiʻi a me ka hana ʻōlelo. ʻAʻole i emi wale kēia ʻano i nā koi o kēia wā, akā hiki iā ʻoe ke hana wikiwiki i nā kiʻi.

Ua maʻalahi ke aʻo ʻana i nā pūnaewele neural, no ka mea, ua hana mākou i kahi code promo no Habravchan HABR, e hāʻawi ana i kahi hōʻemi hou 10% i ka hōʻemi i hōʻike ʻia ma ka hae.

Ke hoʻohana nei iā AI e hoʻopā i nā kiʻi

Nā papa hou aʻe

Nā ʻatikala

Source: www.habr.com

Pākuʻi i ka manaʻo hoʻopuka