Истифодаи AI барои аз ҳад зиёд фишурдани тасвирҳо

Истифодаи AI барои аз ҳад зиёд фишурдани тасвирҳо
Алгоритмҳои ба маълумот асосёфта, аз қабили шабакаҳои нейронӣ ҷаҳонро ба хашм овардаанд. Рушди онҳо бо якчанд сабабҳо, аз ҷумла сахтафзори арзон ва пурқувват ва миқдори зиёди додаҳо вобаста аст. Шабакаҳои нейронӣ дар айни замон дар ҳама чизҳои марбут ба "маърифат" ҳастанд, ба монанди шинохти тасвир, фаҳмиши забони табиӣ ва ғайра. Вале онхо набояд бо чунин вазифахо махдуд шаванд. Ин мавод усули фишурдани тасвирҳоро бо истифода аз шабакаҳои нейрон бо истифода аз омӯзиши боқимонда тавсиф мекунад. Усули дар мақола овардашуда нисбат ба кодекҳои стандартӣ тезтар ва беҳтар кор мекунад. Нақшаҳо, муодилаҳо ва, албатта, ҷадвал бо санҷишҳо дар зери набуред.

Ин мақола дар асоси ин кор. Тахмин меравад, ки шумо бо шабакаҳои нейрон ва мафҳумҳои онҳо шинос ҳастед гардиш и функсияи талафот.

Фишурдани тасвир чист ва он дар кадом намудҳо пайдо мешавад?

Фишурдани тасвир раванди табдил додани тасвир аст, то ки он фазои камтарро ишғол кунад. Танҳо нигоҳ доштани тасвирҳо фазои зиёдеро ишғол мекунад, аз ин рӯ кодекҳо ба монанди JPEG ва PNG мавҷуданд, ки ҳадафи он кам кардани андозаи тасвири аслӣ мебошанд.

Тавре ки шумо медонед, ду намуди фишурдани тасвир вуҷуд дорад: талафот нест и бо талафот. Тавре ки аз номҳо бармеояд, фишурдани бе талаф метавонад маълумоти аслии тасвирро барқарор кунад, дар ҳоле ки фишурдани гумшуда дар вақти фишурда баъзе маълумотҳоро аз даст медиҳад. масалан, JPG алгоритмҳои гумшуда мебошанд [тақрибан. тарҷума - асосан, биёед дар бораи JPEG-и бе талаф фаромӯш накунем], ва PNG як алгоритми бе талафот аст.

Истифодаи AI барои аз ҳад зиёд фишурдани тасвирҳо
Муқоисаи фишурдани бе талаф ва талафот

Аҳамият диҳед, ки тасвири дар тарафи рост мавҷудбуда асарҳои зиёде дорад. Ин маълумоти гумшуда аст. Пикселҳои ҳамсояи рангҳои шабеҳ ҳамчун як минтақа фишурда мешаванд, то ҷойгоҳ сарфа карда шаванд, аммо маълумот дар бораи пикселҳои воқеӣ гум мешавад. Албатта, алгоритмҳое, ки дар кодекҳои JPEG, PNG ва ғайра истифода мешаванд, хеле мураккабтаранд, аммо ин як намунаи хуби фишурдани талафот аст. Фишурдани бе талаф хуб аст, аммо файлҳои бе талаф фишурда фазои зиёди дискро ишғол мекунанд. Роҳҳои самараноктари фишурдани тасвирҳо бе талафоти зиёди иттилоот вуҷуд доранд, аммо онҳо хеле сустанд ва бисёриҳо равишҳои такрориро истифода мебаранд. Ин маънои онро дорад, ки онҳо наметавонанд дар як ядрои сершумори CPU ё GPU мувозӣ кор кунанд. Ин маҳдудият онҳоро барои истифодаи ҳамарӯза комилан ғайриимкон месозад.

Вуруди шабакаи нейронҳои конволютсионӣ

Агар чизеро ҳисоб кардан лозим бошад ва ҳисобҳо тахминӣ бошанд, илова кунед шабакаи нейрон. Муаллифон барои беҳтар кардани фишурдани тасвир як шабакаи одилонаи стандартии конволютсионӣ истифода карданд. Усули пешниҳодшуда на танҳо дар баробари беҳтарин қарорҳо амал мекунад (агар беҳтар набошад), он инчунин метавонад ҳисоббарории мувозиро истифода барад, ки дар натиҷа суръат ба таври назаррас афзоиш меёбад. Сабаб дар он аст, ки шабакаҳои нейронҳои конволютсионӣ (CNN) дар истихроҷи иттилооти фазоӣ аз тасвирҳо хеле хубанд, ки баъдан дар шакли паймонтар муаррифӣ мешаванд (масалан, танҳо битҳои "муҳим" -и тасвир нигоҳ дошта мешаванд). Муаллифон мехостанд аз ин хусусияти CNN истифода баранд, то тасвирҳоро беҳтар муаррифӣ кунанд.

меъморӣ

Муаллифон як шабакаи дугонаро пешниҳод карданд. Шабакаи аввал тасвирро ҳамчун вуруд мегирад ва намояндагии паймон (ComCNN) тавлид мекунад. Натиҷаи ин шабака баъдан тавассути кодеки стандартӣ (ба монанди JPEG) коркард мешавад. Пас аз коркарди кодек, тасвир ба шабакаи дуюм фиристода мешавад, ки тасвирро аз кодек бо кӯшиши баргардонидани тасвири аслӣ "ислоҳ" мекунад. Муаллифон ин шабакаро бозсозии CNN (RecCNN) номидаанд. Мисли GANҳо, ҳарду шабака ба таври такрорӣ омӯзонида мешаванд.

Истифодаи AI барои аз ҳад зиёд фишурдани тасвирҳо
Намояндагии ComCNN Compact ба кодеки стандартӣ интиқол дода мешавад

Истифодаи AI барои аз ҳад зиёд фишурдани тасвирҳо
RecCNN. Натиҷаи ComCNN такмил дода мешавад ва ба RecCNN дода мешавад, ки кӯшиш мекунад боқимондаашро омӯзад

Натиҷаи кодек такмил дода мешавад ва сипас ба RecCNN дода мешавад. RecCNN кӯшиш хоҳад кард, ки тасвире ба қадри имкон ба аслӣ монанд бошад.

Истифодаи AI барои аз ҳад зиёд фишурдани тасвирҳо
Чаҳорчӯбаи фишурдасозии тасвир аз охири ба охир. Co(.) алгоритми фишурдани тасвир аст. Муаллифон JPEG, JPEG2000 ва BPG-ро истифода бурданд

Боқимонда чист?

Қисми боқимондаро метавон ҳамчун як қадами пас аз коркард барои "такмил додани" тасвири рамзкушоӣ аз ҷониби кодек баррасӣ кард. Бо миқдори зиёди "маълумот" дар бораи ҷаҳон, як шабакаи нейрон метавонад дар бораи ислоҳ кардани он қарорҳои маърифатӣ қабул кунад. Ин идея ба он асос ёфтааст таълими боқимонда, тафсилотро хонед, ки шумо метавонед дар ин ҷо.

Функсияҳои талафот

Ду функсияи талафот истифода мешаванд, зеро мо ду шабакаи нейрон дорем. Аввалин аз онҳо, ComCNN, L1 нишон дода шудааст ва ба таври зерин муайян карда мешавад:

Истифодаи AI барои аз ҳад зиёд фишурдани тасвирҳо
Функсияи талафот барои ComCNN

Шарҳ

Ин муодила метавонад мураккаб ба назар расад, аммо он дар асл стандартӣ аст (хатои миёнаи квадратӣ) MSE. ||² маънои меъёри вектореро, ки онҳо иҳота мекунанд.

Истифодаи AI барои аз ҳад зиёд фишурдани тасвирҳо
Муодилаи 1.1

Cr баромади ComCNN-ро ифода мекунад. θ қобилияти омӯзиши параметрҳои ComCNN-ро ифода мекунад, XK тасвири воридотӣ мебошад

Истифодаи AI барои аз ҳад зиёд фишурдани тасвирҳо
Муодилаи 1.2

Re() барои RecCNN рост меояд. Ин муодила танҳо арзиши муодилаи 1.1-ро ба RecCNN мегузарад. θ параметрҳои омӯзишшавандаи RecCNN-ро ифода мекунад (сарпӯши боло маънои онро дорад, ки параметрҳо собит шудаанд).

Таърифи интуитивӣ

Муодилаи 1.0 ComCNN-ро маҷбур мекунад, ки вазнҳояшро тағир диҳад, то ҳангоми азнавсозӣ бо истифода аз RecCNN, тасвири ниҳоӣ то ҳадди имкон ба тасвири воридшуда монанд бошад. Функсияи дуюми талафоти RecCNN ба таври зерин муайян карда мешавад:

Истифодаи AI барои аз ҳад зиёд фишурдани тасвирҳо
Муодилаи 2.0

Шарҳ

Боз ин функсия метавонад мураккаб ба назар расад, аммо он дар аксар маврид функсияи стандартии талафоти шабакаи нейронӣ (MSE) мебошад.

Истифодаи AI барои аз ҳад зиёд фишурдани тасвирҳо
Муодилаи 2.1

Co() маънои баромади кодек, x бо сарпӯши боло маънои баромади ComCNN. θ2 параметрҳои таълимшавандаи RecCNN мебошанд, res() ин танҳо натиҷаи боқимондаи RecCNN аст. Бояд қайд кард, ки RecCNN дар бораи фарқияти байни Co() ва тасвири воридотӣ омӯзонида шудааст, аммо на дар тасвири вуруд.

Таърифи интуитивӣ

Муодилаи 2.0 RecCNN-ро маҷбур мекунад, ки вазнҳои худро тағир диҳад, то натиҷа ба тасвири воридотӣ то ҳадди имкон монанд бошад.

Схемаи таълим

Моделҳо ба таври такрорӣ омӯзонида мешаванд, ба монанди GAN. Вазни модели якум ҳангоми навсозии вазнҳои модели дуюм муқаррар карда мешавад, баъд вазнҳои модели дуюм ҳангоми омӯзонидани модели якум муқаррар карда мешаванд.

Санҷишҳо

Муаллифон усули худро бо усулҳои мавҷуда, аз ҷумла кодекҳои оддӣ муқоиса карданд. Усули онҳо нисбат ба дигарон беҳтар кор мекунад ва суръати баландро дар сахтафзори мувофиқ нигоҳ медорад. Илова бар ин, муаллифон кӯшиш карданд, ки танҳо яке аз ин ду шабакаро истифода баранд ва коҳиши иҷроишро қайд карданд.

Истифодаи AI барои аз ҳад зиёд фишурдани тасвирҳо
Муқоисаи шохиси шабоҳати сохторӣ (SSIM). Арзишҳои баланд шабеҳи беҳтар ба аслро нишон медиҳанд. Натичахои кори муаллифон бо харфи гафс нишон дода шудаанд.

хулоса

Мо роҳи нави истифодаи омӯзиши амиқро барои фишурдани тасвир дида баромадем ва дар бораи имкони истифодаи шабакаҳои нейрон дар вазифаҳои берун аз "умумӣ", ба монанди таснифоти тасвирҳо ва коркарди забон сӯҳбат кардем. Ин усул на танхо аз талаботи хозира кам нест, балки имкон медихад, ки тасвирхо хеле тезтар кор карда шаванд.

Омӯзиши шабакаҳои нейрон осонтар шуд, зеро мо махсусан барои сокинони Хабра як рамзи таблиғотро таҳия кардем ХАБР, додани 10% тахфифи иловагӣ ба тахфифи дар баннер нишондодашуда.

Истифодаи AI барои аз ҳад зиёд фишурдани тасвирҳо

Курсҳои бештар

Мақолаҳои пешниҳодшуда

Манбаъ: will.com

Илова Эзоҳ