Tha algoirmean stèidhichte air dàta leithid lìonraidhean neural air an saoghal a ghlacadh le stoirm. Tha an leasachadh air sgàth grunn adhbharan, a 'gabhail a-steach uidheam saor is cumhachdach agus tòrr dàta. Tha lìonraidhean neural an-dràsta aig fìor thoiseach a h-uile càil co-cheangailte ri gnìomhan “inntinneach” leithid aithneachadh ìomhaighean, tuigse cànain nàdarra, msaa. Ach cha bu chòir dhaibh a bhith cuingealaichte ri gnìomhan mar sin. Tha an artaigil seo a’ bruidhinn air mar as urrainn dhut ìomhaighean a dhlùthadh a’ cleachdadh lìonraidhean neural, a’ cleachdadh ionnsachadh air fhàgail. Tha an dòigh-obrach a tha air a thaisbeanadh san artaigil nas luaithe agus nas fheàrr na codecs àbhaisteach. Sgeamaichean, co-aontaran agus, gu dearbh, clàr le deuchainnean fon ghearradh.
Tha an artaigil seo stèidhichte air seo obair. Thathas a’ gabhail ris gu bheil thu eòlach air lìonraidhean neural agus na bun-bheachdan aca. convolution и gnìomh call.
Dè a th’ ann an teannachadh ìomhaigh agus ciamar a tha e ag obair?
Is e teannachadh ìomhaigh am pròiseas airson ìomhaigh a thionndadh gus an toir e nas lugha de rùm. Bheireadh dìreach stòradh ìomhaighean tòrr àite, agus is e sin as coireach gu bheil codecs leithid JPEG agus PNG ann a tha ag amas air meud na h-ìomhaigh thùsail a lughdachadh.
Mar a tha fios agad, tha dà sheòrsa de dhlùthadh ìomhaigh ann: gun chall и le call. Mar a tha na h-ainmean a’ moladh, faodaidh teannachadh gun chall an dàta ìomhaigh tùsail a chumail, fhad ‘s a bhios teannachadh call a’ call cuid de dhàta aig àm teannachaidh. mar eisimpleir, tha JPG nan algorithms call [approx. eadar-theangachadh. - gu bunaiteach, na dìochuimhnich sinn cuideachd mu JPEG gun chall], agus tha PNG na algairim gun chall.
Coimeas eadar teannachadh gun chall agus call
Mothaich gu bheil tòrr stuthan bacaidh san ìomhaigh air an làimh dheis. Is e fiosrachadh caillte a tha seo. Tha piogsail faisg air làimh de dhhathan coltach ris air an teannachadh mar aon raon gus àite a shàbhaladh, ach tha fiosrachadh mu na piogsail fhèin air chall. Gu dearbh, tha na h-algorithms a thathas a’ cleachdadh anns na còdaichean JPEG, PNG, msaa tòrr nas iom-fhillte, ach tha seo na dheagh eisimpleir intuitive de dhlùthadh call. Tha teannachadh gun chall math, ach bidh faidhlichean teannachaidh gun chall a’ gabhail tòrr àite diosc. Tha dòighean nas fheàrr air ìomhaighean a dhlùthadh gun a bhith a’ call mòran fiosrachaidh, ach tha iad gu math slaodach agus bidh mòran a’ cleachdadh dhòighean ath-aithriseach. Tha seo a’ ciallachadh nach urrainn dhaibh a bhith air an ruith aig an aon àm air grunn choraichean CPU no GPU. Tha an cuingealachadh seo gan dèanamh gu tur neo-phractaigeach ann an cleachdadh làitheil.
Cuir a-steach Lìonra Neural Convolutional
Ma dh’ fheumar rudeigin a thomhas agus gum faod an àireamhachadh a bhith tuairmseach, cuir ris lìonra neural. Chleachd na h-ùghdaran lìonra neural convolutional gu ìre mhath gus teannachadh ìomhaighean a leasachadh. Tha an dòigh a tha air a thaisbeanadh chan ann a-mhàin a 'coileanadh co-ionann ris na fuasglaidhean as fheàrr (mura h-eil e nas fheàrr), faodaidh e cuideachd coimpiutaireachd co-shìnte a chleachdadh, a tha a' leantainn gu àrdachadh mòr ann an astar. Is e an t-adhbhar gu bheil Convolutional Neural Networks (CNNn) fìor mhath air fiosrachadh spàsail a thoirt a-mach à ìomhaighean, a tha an uairsin air a thaisbeanadh ann an cruth nas toinnte (mar eisimpleir, chan eil ach na pìosan “cudromach” den ìomhaigh air an gleidheadh). Bha na h-ùghdaran airson an comas CNN seo a chleachdadh gus na h-ìomhaighean a riochdachadh nas fheàrr.
ailtireachd
Mhol na h-ùghdaran lìonra dùbailte. Bidh a’ chiad lìonra a’ gabhail ìomhaigh mar chur-a-steach agus a’ gineadh riochdachadh teann (ComCNN). Bidh toradh an lìonraidh seo an uairsin air a phròiseasadh le codec àbhaisteach (me JPEG). An dèidh a bhith air a phròiseasadh leis a 'chòd, thèid an ìomhaigh a ghluasad gu dàrna lìonra, a bhios "a' rèiteachadh" an ìomhaigh bhon chòd ann an oidhirp an ìomhaigh thùsail a thilleadh. Dh'ainmich na h-ùghdaran an lìonra seo Reconstructive CNN (RecCNN). Coltach ri GANn, tha an dà lìonra air an trèanadh a-rithist.
Tha riochdachadh Compact ComCNN air a chuir gu codec àbhaisteach
RecCNN. Tha toradh ComCNN air a mheudachadh agus air a bhiadhadh gu RecCNN, a dh’ fheuchas ris a’ chòrr ionnsachadh
Tha toradh an codec air a mheudachadh agus an uairsin air a chuir gu RecCNN. Feuchaidh RecCNN ris an ìomhaigh a dhèanamh cho faisg air an fhear thùsail sa ghabhas.
Frèam teannachaidh ìomhaigh deireadh-gu-deireadh. Co (.) na algairim teannachaidh ìomhaigh. Chleachd na h-ùghdaran JPEG, JPEG2000 agus BPG
Dè th' ann an còrr?
Faodar smaoineachadh air a’ chòrr mar cheum iar-ghiollachd gus an ìomhaigh a tha air a dhì-chòdachadh leis a’ chòd “leasachadh”. Le tòrr “fiosrachadh” mun t-saoghal, faodaidh lìonra neòil co-dhùnaidhean inntinneil a dhèanamh a thaobh dè a bu chòir a chàradh. Tha am beachd seo stèidhichte air ionnsachadh air fhàgail, leugh am mion-fhiosrachadh as urrainn dhut an seo.
Feartan call
Tha an dà ghnìomh call air an cleachdadh leis gu bheil dà lìonra neural againn. Tha a’ chiad fhear dhiubh sin, ComCNN, air a chomharrachadh le L1 agus tha e air a mhìneachadh mar a leanas:
Gnìomh call airson ComCNN
Mìneachadh
Is dòcha gu bheil an co-aontar seo a’ coimhead toinnte, ach is e an ìre àbhaisteach a th’ ann (mearachd ceàrnagach mean air mhean) MSE. Tha ||² a’ ciallachadh àbhaisteach an vectar a tha iad a’ cuairteachadh.
Co-aontar 1.1
Tha Cr a’ comharrachadh toradh ComCNN. θ a’ comharrachadh comas ionnsachaidh paramadairean ComCNN, is e XK an ìomhaigh cuir a-steach
Co-aontar 1.2
Re() a’ ciallachadh RecCNN. Tha an co-aontar seo dìreach a’ toirt brìgh co-aontar 1.1 gu RecCNN. θ a’ comharrachadh paramadairean trèanaidh RecCNN (tha ad air a’ mhullach a’ ciallachadh gu bheil na crìochan stèidhichte).
Mìneachadh Intuitive
Bheir Co-aontar 1.0 air ComCNN na cuideaman aige atharrachadh gus am bi an ìomhaigh mu dheireadh a’ coimhead cho coltach ‘s a ghabhas ris an ìomhaigh cuir a-steach nuair a thèid ath-chruthachadh le RecCNN. Tha an dàrna gnìomh call RecCNN air a mhìneachadh mar a leanas:
Co-aontar 2.0
Mìneachadh
A-rithist, is dòcha gum bi an gnìomh a’ coimhead iom-fhillte, ach sa mhòr-chuid tha seo na ghnìomh call lìonra neural àbhaisteach (MSE).
Co-aontar 2.1
Co() a’ ciallachadh toradh codec, tha x le ad air a’ mhullach a’ ciallachadh toradh ComCNN. Tha θ2 nam paramadairean trèanaidh RecCNN, res() dìreach an toradh a tha air fhàgail aig RecCNN. Is fhiach a bhith mothachail gu bheil RecCNN air a thrèanadh air an eadar-dhealachadh eadar Co () agus an ìomhaigh cuir a-steach, ach chan ann air an ìomhaigh cuir a-steach.
Mìneachadh Intuitive
Bheir co-aontar 2.0 air RecCNN na cuideaman aige atharrachadh gus am bi an toradh a’ coimhead cho coltach ‘s a ghabhas ris an ìomhaigh cuir a-steach.
Sgeama ionnsachaidh
Tha modalan air an trèanadh gu ath-aithriseach, mar GAN. Tha cuideaman a 'chiad mhodail air an suidheachadh fhad' sa thathar ag ùrachadh cuideaman an dàrna modail, agus an uairsin bidh cuideaman an dàrna modail air an suidheachadh fhad 'sa tha a' chiad mhodail ga thrèanadh.
Deuchainnean
Rinn na h-ùghdaran coimeas eadar an dòigh aca agus dòighean a th’ ann mar-thà, a’ toirt a-steach codecs sìmplidh. Bidh an dòigh aca a’ coileanadh nas fheàrr na feadhainn eile fhad ‘s a chumas iad astar àrd air a’ bhathar-cruaidh iomchaidh. A bharrachd air an sin, dh’ fheuch na h-ùghdaran ri dìreach aon den dà lìonra a chleachdadh agus thug iad fa-near lùghdachadh ann an coileanadh.
Coimeas Clàr-innse Co-chosmhail Structarail (SSIM). Tha luachan àrda a’ nochdadh coltas nas fheàrr ris an fhear thùsail. Tha an seòrsa trom a’ comharrachadh toradh obair nan ùghdaran
co-dhùnadh
Choimhead sinn air dòigh ùr air ionnsachadh domhainn a chuir an sàs ann an teannachadh ìomhaighean, agus bhruidhinn sinn air comasachd lìonraidhean neural a chleachdadh ann an gnìomhan taobh a-muigh gnìomhan “coitcheann” leithid seòrsachadh ìomhaighean agus giollachd cànain. Chan e a-mhàin gu bheil an dòigh seo nas ìsle na riatanasan an latha an-diugh, ach leigidh e leat ìomhaighean a phròiseasadh fada nas luaithe.
Tha ionnsachadh lìonraidhean neural air fàs nas fhasa, oir rinn sinn còd promo gu sònraichte airson Habravchan HABR, a 'toirt seachad lasachadh 10% a bharrachd air an lasachadh a tha air a chomharrachadh air a' bhratach.