ʻO nā algorithms i hoʻokele ʻia e ka ʻikepili e like me nā neural network i lawe i ka honua ma ka ʻino. ʻO kā lākou hoʻomohala ʻana ma muli o nā kumu he nui, ʻo ia hoʻi nā mea hana maʻalahi a ikaika a me ka nui o ka ʻikepili. Aia nā pūnaewele neural i kēia manawa ma mua o nā mea a pau e pili ana i nā hana "cognitive" e like me ka ʻike kiʻi, ka ʻike ʻōlelo kūlohelohe, etc. Akā ʻaʻole pono lākou e kaupalena ʻia i ia mau hana. Ke kamaʻilio nei kēia ʻatikala e pili ana i ka hoʻopili ʻana i nā kiʻi me ka hoʻohana ʻana i nā neural network, me ka hoʻohana ʻana i ke koena aʻo. ʻOi aku ka wikiwiki a ʻoi aku ka maikaʻi o ke ala i hōʻike ʻia ma ka ʻatikala ma mua o nā codec maʻamau. Schemes, equations a, ʻoiaʻiʻo, he papa me nā hoʻāʻo ma lalo o ka ʻoki.
Hoʻokumu ʻia kēia ʻatikala ma kēia hana. Manaʻo ʻia ua kamaʻāina ʻoe i nā neural network a me kā lākou mau manaʻo. huikau и hana poho.
He aha ka hoʻopili kiʻi a pehea e hana ai?
ʻO ka hoʻoemi kiʻi ke kaʻina hana o ka hoʻololi ʻana i kahi kiʻi i mea e liʻiliʻi ai ka nui. ʻO ka mālama wale ʻana i nā kiʻi e lawe i kahi nui, ʻo ia ke kumu i loaʻa ai nā codecs e like me JPEG a me PNG e manaʻo nei e hōʻemi i ka nui o ke kiʻi kumu.
E like me kāu e ʻike ai, ʻelua ʻano o ke kaomi kiʻi: ʻaʻohe poho и me na poho. E like me ka hōʻike ʻana o nā inoa, hiki ke hoʻopaʻa ʻia ka compression lossless i ka ʻikepili kiʻi kumu, aʻo ka compression lossy e nalowale kekahi mau ʻikepili i ka wā o ke kōmi ʻana. no ka laʻana, ʻo JPG nā algorithms lossy [approx. unuhi. - ma ke ano, mai poina kakou e pili ana i ka lossless JPEG], a me PNG kahi algorithm lossless.
Hoʻohālikelike i ka hoʻoemi ʻole a me ka poho
E nānā i ka nui o nā mea hana blocky ma ke kiʻi ma ka ʻākau. Ua nalowale kēia ʻike. Hoʻopili ʻia nā pika pili o nā waihoʻoluʻu like i kahi wahi e mālama ai i ka lewa, akā nalowale ka ʻike e pili ana i nā pika maoli. ʻOiaʻiʻo, ʻoi aku ka paʻakikī o nā algorithms i hoʻohana ʻia ma ka JPEG, PNG, etc. codecs, akā he hiʻohiʻona intuitive maikaʻi kēia o ka hoʻopiʻi lossy. Maikaʻi ka hoʻoemi ʻole ʻana, akā ʻo nā faila i hoʻopaʻa ʻole ʻia e lawe i ka nui o nā wahi disk. Aia nā ala maikaʻi aʻe e hoʻopaʻa i nā kiʻi me ka nalowale ʻole o ka ʻike, akā lohi lākou a hoʻohana nui i nā ala iterative. ʻO kēia ke ʻano ʻaʻole hiki iā lākou ke holo like ma luna o nā cores CPU a i ʻole GPU. ʻO kēia palena ka mea i hiki ʻole iā lākou ke hoʻohana i kēlā me kēia lā.
Hoʻokomo ʻia ʻo Convolutional Neural Network
Inā pono e helu ʻia kekahi mea a hiki ke hoʻohālikelike ʻia nā helu, hoʻohui pūnaewele neural. Ua hoʻohana nā mea kākau i kahi pūnaewele neural convolutional maʻamau e hoʻomaikaʻi i ka hoʻopili kiʻi. ʻAʻole hana wale ke ʻano i hōʻike ʻia ma ka par me nā hopena maikaʻi loa (inā ʻaʻole ʻoi aku ka maikaʻi), hiki nō ke hoʻohana i ka computing parallel, e alakaʻi ana i ka piʻi nui o ka wikiwiki. ʻO ke kumu, he maikaʻi loa nā Convolutional Neural Networks (CNNs) i ka unuhi ʻana i ka ʻike kikoʻī mai nā kiʻi, a laila hōʻike ʻia ma kahi ʻano paʻakikī (no ka laʻana, mālama ʻia nā ʻāpana "koʻikoʻi" o ke kiʻi). Ua makemake nā mea kākau e hoʻohana i kēia hiki iā CNN e hōʻike maikaʻi i nā kiʻi.
kuhikuhipuʻuone
Ua manaʻo nā mea kākau i kahi pūnaewele pālua. Lawe ka pūnaewele mua i kahi kiʻi ma ke ʻano he hoʻokomo a hana i kahi hōʻike paʻa (ComCNN). Hoʻohana ʻia ka hoʻopuka ʻana o kēia pūnaewele e kahi codec maʻamau (e like me JPEG). Ma hope o ka hoʻoponopono ʻia ʻana e ka codec, ua hāʻawi ʻia ke kiʻi i kahi pūnaewele lua, e "hoʻoponopono" i ke kiʻi mai ka codec i ka hoʻāʻo e hoʻihoʻi i ke kiʻi kumu. Ua kapa nā mea kākau i kēia pūnaewele Reconstructive CNN (RecCNN). E like me nā GAN, ua aʻo ʻia nā pūnaewele ʻelua.
Hāʻawi ʻia ka hōʻike ComCNN Compact i ka codec maʻamau
RecCNN. Hoʻonui ʻia ka hoʻopuka ComCNN a hāʻawi ʻia iā RecCNN, nāna e hoʻāʻo e aʻo i ke koena
Hoʻonui ʻia ka huahana codec a laila hāʻawi ʻia iā RecCNN. E ho'āʻo ʻo RecCNN e hoʻolilo i ke kiʻi i kahi kokoke i ke kiʻi kumu.
Ka hoʻoemi kiʻi hope-a-hope. ʻO Co(.) kahi algorithm kaomi kiʻi. Ua hoʻohana nā mea kākau iā JPEG, JPEG2000 a me BPG
He aha ke koena?
Hiki ke noʻonoʻo ʻia ke koena ma ke ʻano he kaʻina hana hope e "hoʻomaikaʻi" i ke kiʻi i hoʻokaʻawale ʻia e ke codec. Loaʻa ka nui o ka "ʻike" e pili ana i ka honua, hiki i kahi neural network ke hana i nā hoʻoholo cognitive e pili ana i ka mea e hoʻoponopono ai. Hoʻokumu ʻia kēia manaʻo ma luna o aʻo koena, e heluhelu i nā kikoʻī e pili ana iā ʻoe maanei.
Nā hana poho
Hoʻohana ʻia nā hana poho ʻelua no ka mea he ʻelua mau neural network mākou. ʻO ka mua o kēia, ComCNN, ua kapa ʻia ʻo L1 a ua wehewehe ʻia penei:
Hana poho no ComCNN
ʻO ka wehewehe
Me he mea paʻakikī paha kēia hoohalike, akā ʻo ia ka mea maʻamau (ke kumu mean square error) MSE. ||² ʻo ia ka mea maʻamau o ka vector a lākou i hoʻopili ai.
Hoʻohālike 1.1
Hōʻike ka Cr i ka puka o ComCNN. θ hōʻike i ke aʻo ʻana o nā ʻāpana ComCNN, ʻo XK ke kiʻi hoʻokomo
Hoʻohālike 1.2
Re() kū no RecCNN. Hāʻawi wale kēia hoohalike i ke ʻano o ka hoohalike 1.1 i RecCNN. Hōʻike ka θ i nā ʻāpana hoʻomaʻamaʻa RecCNN (ʻo ka pāpale ma luna ʻo ia ka paʻa o nā ʻāpana).
Wehewehe ʻike
E hoʻololi ka hoʻohālikelike 1.0 i ka ComCNN i kāna mau kaupaona a i ka wā i hana hou ʻia me RecCNN, ʻano like ke kiʻi hope me ke kiʻi hoʻokomo. Ua wehewehe ʻia ka lua o ka hana poho RecCNN penei:
Hoʻohālike 2.0
ʻO ka wehewehe
Eia hou, paʻakikī paha ka hana, akā ʻo kēia ka hapa nui o ka hana neural network loss (MSE).
Hoʻohālike 2.1
Co() 'o ia ho'i ka ho'opuka codec, x me ka pāpale ma luna 'o ia ho'i ka ho'opuka ComCNN. ʻO θ2 nā ʻāpana hoʻonaʻauao RecCNN, res() ʻo ia wale nō ke koena o RecCNN. Pono e hoʻomaopopo ʻia ua aʻo ʻia ʻo RecCNN ma ka ʻokoʻa ma waena o Co() a me ke kiʻi hoʻokomo, akā ʻaʻole ma ke kiʻi hoʻokomo.
Wehewehe ʻike
E hoʻololi ka hoʻohālikelike 2.0 i ka RecCNN i kona mau kaupaona i mea e like ai ka hopena me ke kiʻi hoʻokomo.
Papahana aʻo
Hoʻomaʻamaʻa ʻia nā ʻano hoʻohālike, e like me GAN. Hoʻopaʻa ʻia nā paona o ke kumu hoʻohālike mua i ka wā e hoʻonui ʻia ana nā paona o ke kumu hoʻohālike ʻelua, a laila hoʻopaʻa ʻia nā paona o ke kumu hoʻohālike ʻelua i ka wā e aʻo ʻia ana ke kumu hoʻohālike mua.
Nā ho'āʻo
Ua hoʻohālikelike nā mea kākau i kā lākou ʻano me nā ala e kū nei, me nā codec maʻalahi. ʻOi aku ka maikaʻi o kā lākou ʻano hana ma mua o nā mea ʻē aʻe me ka mālama ʻana i ka wikiwiki kiʻekiʻe ma ka hāmeʻa kūpono. Eia kekahi, ua ho'āʻo nā mea kākau e hoʻohana i hoʻokahi wale nō o nā pūnaewele ʻelua a ʻike i kahi hāʻule o ka hana.
Hoʻohālikelike Hoʻohālikelike Kūlike Kūlike (SSIM). Hōʻike nā waiwai kiʻekiʻe i kahi like maikaʻi aʻe i ka mea kumu. Hōʻike ke ʻano wiwo ʻole i ka hopena o ka hana a nā mea kākau
hopena
Ua nānā mākou i kahi ala hou e hoʻopili ai i ke aʻo hohonu i ka paʻi kiʻi, a kamaʻilio e pili ana i ka hiki ke hoʻohana i nā neural network i nā hana ma mua o nā hana "nui" e like me ka hoʻokaʻawale kiʻi a me ka hana ʻōlelo. ʻAʻole i emi wale kēia ʻano i nā koi o kēia wā, akā hiki iā ʻoe ke hana wikiwiki i nā kiʻi.
Ua maʻalahi ke aʻo ʻana i nā pūnaewele neural, no ka mea, ua hana mākou i kahi code promo no Habravchan HABR, e hāʻawi ana i kahi hōʻemi hou 10% i ka hōʻemi i hōʻike ʻia ma ka hae.