A’ cleachdadh AI gus cus ìomhaighean a dhùsgadh

A’ cleachdadh AI gus cus ìomhaighean a dhùsgadh
Tha algoirmean stèidhichte air dàta leithid lìonraidhean neural air an saoghal a ghlacadh le stoirm. Tha an leasachadh air sgàth grunn adhbharan, a 'gabhail a-steach uidheam saor is cumhachdach agus tòrr dàta. Tha lìonraidhean neural an-dràsta aig fìor thoiseach a h-uile càil co-cheangailte ri gnìomhan “inntinneach” leithid aithneachadh ìomhaighean, tuigse cànain nàdarra, msaa. Ach cha bu chòir dhaibh a bhith cuingealaichte ri gnìomhan mar sin. Tha an artaigil seo a’ bruidhinn air mar as urrainn dhut ìomhaighean a dhlùthadh a’ cleachdadh lìonraidhean neural, a’ cleachdadh ionnsachadh air fhàgail. Tha an dòigh-obrach a tha air a thaisbeanadh san artaigil nas luaithe agus nas fheàrr na codecs àbhaisteach. Sgeamaichean, co-aontaran agus, gu dearbh, clàr le deuchainnean fon ghearradh.

Tha an artaigil seo stèidhichte air seo obair. Thathas a’ gabhail ris gu bheil thu eòlach air lìonraidhean neural agus na bun-bheachdan aca. convolution и gnìomh call.

Dè a th’ ann an teannachadh ìomhaigh agus ciamar a tha e ag obair?

Is e teannachadh ìomhaigh am pròiseas airson ìomhaigh a thionndadh gus an toir e nas lugha de rùm. Bheireadh dìreach stòradh ìomhaighean tòrr àite, agus is e sin as coireach gu bheil codecs leithid JPEG agus PNG ann a tha ag amas air meud na h-ìomhaigh thùsail a lughdachadh.

Mar a tha fios agad, tha dà sheòrsa de dhlùthadh ìomhaigh ann: gun chall и le call. Mar a tha na h-ainmean a’ moladh, faodaidh teannachadh gun chall an dàta ìomhaigh tùsail a chumail, fhad ‘s a bhios teannachadh call a’ call cuid de dhàta aig àm teannachaidh. mar eisimpleir, tha JPG nan algorithms call [approx. eadar-theangachadh. - gu bunaiteach, na dìochuimhnich sinn cuideachd mu JPEG gun chall], agus tha PNG na algairim gun chall.

A’ cleachdadh AI gus cus ìomhaighean a dhùsgadh
Coimeas eadar teannachadh gun chall agus call

Mothaich gu bheil tòrr stuthan bacaidh san ìomhaigh air an làimh dheis. Is e fiosrachadh caillte a tha seo. Tha piogsail faisg air làimh de dhhathan coltach ris air an teannachadh mar aon raon gus àite a shàbhaladh, ach tha fiosrachadh mu na piogsail fhèin air chall. Gu dearbh, tha na h-algorithms a thathas a’ cleachdadh anns na còdaichean JPEG, PNG, msaa tòrr nas iom-fhillte, ach tha seo na dheagh eisimpleir intuitive de dhlùthadh call. Tha teannachadh gun chall math, ach bidh faidhlichean teannachaidh gun chall a’ gabhail tòrr àite diosc. Tha dòighean nas fheàrr air ìomhaighean a dhlùthadh gun a bhith a’ call mòran fiosrachaidh, ach tha iad gu math slaodach agus bidh mòran a’ cleachdadh dhòighean ath-aithriseach. Tha seo a’ ciallachadh nach urrainn dhaibh a bhith air an ruith aig an aon àm air grunn choraichean CPU no GPU. Tha an cuingealachadh seo gan dèanamh gu tur neo-phractaigeach ann an cleachdadh làitheil.

Cuir a-steach Lìonra Neural Convolutional

Ma dh’ fheumar rudeigin a thomhas agus gum faod an àireamhachadh a bhith tuairmseach, cuir ris lìonra neural. Chleachd na h-ùghdaran lìonra neural convolutional gu ìre mhath gus teannachadh ìomhaighean a leasachadh. Tha an dòigh a tha air a thaisbeanadh chan ann a-mhàin a 'coileanadh co-ionann ris na fuasglaidhean as fheàrr (mura h-eil e nas fheàrr), faodaidh e cuideachd coimpiutaireachd co-shìnte a chleachdadh, a tha a' leantainn gu àrdachadh mòr ann an astar. Is e an t-adhbhar gu bheil Convolutional Neural Networks (CNNn) fìor mhath air fiosrachadh spàsail a thoirt a-mach à ìomhaighean, a tha an uairsin air a thaisbeanadh ann an cruth nas toinnte (mar eisimpleir, chan eil ach na pìosan “cudromach” den ìomhaigh air an gleidheadh). Bha na h-ùghdaran airson an comas CNN seo a chleachdadh gus na h-ìomhaighean a riochdachadh nas fheàrr.

ailtireachd

Mhol na h-ùghdaran lìonra dùbailte. Bidh a’ chiad lìonra a’ gabhail ìomhaigh mar chur-a-steach agus a’ gineadh riochdachadh teann (ComCNN). Bidh toradh an lìonraidh seo an uairsin air a phròiseasadh le codec àbhaisteach (me JPEG). An dèidh a bhith air a phròiseasadh leis a 'chòd, thèid an ìomhaigh a ghluasad gu dàrna lìonra, a bhios "a' rèiteachadh" an ìomhaigh bhon chòd ann an oidhirp an ìomhaigh thùsail a thilleadh. Dh'ainmich na h-ùghdaran an lìonra seo Reconstructive CNN (RecCNN). Coltach ri GANn, tha an dà lìonra air an trèanadh a-rithist.

A’ cleachdadh AI gus cus ìomhaighean a dhùsgadh
Tha riochdachadh Compact ComCNN air a chuir gu codec àbhaisteach

A’ cleachdadh AI gus cus ìomhaighean a dhùsgadh
RecCNN. Tha toradh ComCNN air a mheudachadh agus air a bhiadhadh gu RecCNN, a dh’ fheuchas ris a’ chòrr ionnsachadh

Tha toradh an codec air a mheudachadh agus an uairsin air a chuir gu RecCNN. Feuchaidh RecCNN ris an ìomhaigh a dhèanamh cho faisg air an fhear thùsail sa ghabhas.

A’ cleachdadh AI gus cus ìomhaighean a dhùsgadh
Frèam teannachaidh ìomhaigh deireadh-gu-deireadh. Co (.) na algairim teannachaidh ìomhaigh. Chleachd na h-ùghdaran JPEG, JPEG2000 agus BPG

Dè th' ann an còrr?

Faodar smaoineachadh air a’ chòrr mar cheum iar-ghiollachd gus an ìomhaigh a tha air a dhì-chòdachadh leis a’ chòd “leasachadh”. Le tòrr “fiosrachadh” mun t-saoghal, faodaidh lìonra neòil co-dhùnaidhean inntinneil a dhèanamh a thaobh dè a bu chòir a chàradh. Tha am beachd seo stèidhichte air ionnsachadh air fhàgail, leugh am mion-fhiosrachadh as urrainn dhut an seo.

Feartan call

Tha an dà ghnìomh call air an cleachdadh leis gu bheil dà lìonra neural againn. Tha a’ chiad fhear dhiubh sin, ComCNN, air a chomharrachadh le L1 agus tha e air a mhìneachadh mar a leanas:

A’ cleachdadh AI gus cus ìomhaighean a dhùsgadh
Gnìomh call airson ComCNN

Mìneachadh

Is dòcha gu bheil an co-aontar seo a’ coimhead toinnte, ach is e an ìre àbhaisteach a th’ ann (mearachd ceàrnagach mean air mhean) MSE. Tha ||² a’ ciallachadh àbhaisteach an vectar a tha iad a’ cuairteachadh.

A’ cleachdadh AI gus cus ìomhaighean a dhùsgadh
Co-aontar 1.1

Tha Cr a’ comharrachadh toradh ComCNN. θ a’ comharrachadh comas ionnsachaidh paramadairean ComCNN, is e XK an ìomhaigh cuir a-steach

A’ cleachdadh AI gus cus ìomhaighean a dhùsgadh
Co-aontar 1.2

Re() a’ ciallachadh RecCNN. Tha an co-aontar seo dìreach a’ toirt brìgh co-aontar 1.1 gu RecCNN. θ a’ comharrachadh paramadairean trèanaidh RecCNN (tha ad air a’ mhullach a’ ciallachadh gu bheil na crìochan stèidhichte).

Mìneachadh Intuitive

Bheir Co-aontar 1.0 air ComCNN na cuideaman aige atharrachadh gus am bi an ìomhaigh mu dheireadh a’ coimhead cho coltach ‘s a ghabhas ris an ìomhaigh cuir a-steach nuair a thèid ath-chruthachadh le RecCNN. Tha an dàrna gnìomh call RecCNN air a mhìneachadh mar a leanas:

A’ cleachdadh AI gus cus ìomhaighean a dhùsgadh
Co-aontar 2.0

Mìneachadh

A-rithist, is dòcha gum bi an gnìomh a’ coimhead iom-fhillte, ach sa mhòr-chuid tha seo na ghnìomh call lìonra neural àbhaisteach (MSE).

A’ cleachdadh AI gus cus ìomhaighean a dhùsgadh
Co-aontar 2.1

Co() a’ ciallachadh toradh codec, tha x le ad air a’ mhullach a’ ciallachadh toradh ComCNN. Tha θ2 nam paramadairean trèanaidh RecCNN, res() dìreach an toradh a tha air fhàgail aig RecCNN. Is fhiach a bhith mothachail gu bheil RecCNN air a thrèanadh air an eadar-dhealachadh eadar Co () agus an ìomhaigh cuir a-steach, ach chan ann air an ìomhaigh cuir a-steach.

Mìneachadh Intuitive

Bheir co-aontar 2.0 air RecCNN na cuideaman aige atharrachadh gus am bi an toradh a’ coimhead cho coltach ‘s a ghabhas ris an ìomhaigh cuir a-steach.

Sgeama ionnsachaidh

Tha modalan air an trèanadh gu ath-aithriseach, mar GAN. Tha cuideaman a 'chiad mhodail air an suidheachadh fhad' sa thathar ag ùrachadh cuideaman an dàrna modail, agus an uairsin bidh cuideaman an dàrna modail air an suidheachadh fhad 'sa tha a' chiad mhodail ga thrèanadh.

Deuchainnean

Rinn na h-ùghdaran coimeas eadar an dòigh aca agus dòighean a th’ ann mar-thà, a’ toirt a-steach codecs sìmplidh. Bidh an dòigh aca a’ coileanadh nas fheàrr na feadhainn eile fhad ‘s a chumas iad astar àrd air a’ bhathar-cruaidh iomchaidh. A bharrachd air an sin, dh’ fheuch na h-ùghdaran ri dìreach aon den dà lìonra a chleachdadh agus thug iad fa-near lùghdachadh ann an coileanadh.

A’ cleachdadh AI gus cus ìomhaighean a dhùsgadh
Coimeas Clàr-innse Co-chosmhail Structarail (SSIM). Tha luachan àrda a’ nochdadh coltas nas fheàrr ris an fhear thùsail. Tha an seòrsa trom a’ comharrachadh toradh obair nan ùghdaran

co-dhùnadh

Choimhead sinn air dòigh ùr air ionnsachadh domhainn a chuir an sàs ann an teannachadh ìomhaighean, agus bhruidhinn sinn air comasachd lìonraidhean neural a chleachdadh ann an gnìomhan taobh a-muigh gnìomhan “coitcheann” leithid seòrsachadh ìomhaighean agus giollachd cànain. Chan e a-mhàin gu bheil an dòigh seo nas ìsle na riatanasan an latha an-diugh, ach leigidh e leat ìomhaighean a phròiseasadh fada nas luaithe.

Tha ionnsachadh lìonraidhean neural air fàs nas fhasa, oir rinn sinn còd promo gu sònraichte airson Habravchan HABR, a 'toirt seachad lasachadh 10% a bharrachd air an lasachadh a tha air a chomharrachadh air a' bhratach.

A’ cleachdadh AI gus cus ìomhaighean a dhùsgadh

Tuilleadh chùrsaichean

Artaigilean sònraichte

Source: www.habr.com

Cuir beachd ann