Алгоритмҳои ба маълумот асосёфта, аз қабили шабакаҳои нейронӣ ҷаҳонро ба хашм овардаанд. Рушди онҳо бо якчанд сабабҳо, аз ҷумла сахтафзори арзон ва пурқувват ва миқдори зиёди додаҳо вобаста аст. Шабакаҳои нейронӣ дар айни замон дар ҳама чизҳои марбут ба "маърифат" ҳастанд, ба монанди шинохти тасвир, фаҳмиши забони табиӣ ва ғайра. Вале онхо набояд бо чунин вазифахо махдуд шаванд. Ин мавод усули фишурдани тасвирҳоро бо истифода аз шабакаҳои нейрон бо истифода аз омӯзиши боқимонда тавсиф мекунад. Усули дар мақола овардашуда нисбат ба кодекҳои стандартӣ тезтар ва беҳтар кор мекунад. Нақшаҳо, муодилаҳо ва, албатта, ҷадвал бо санҷишҳо дар зери набуред.
Ин мақола дар асоси
Фишурдани тасвир чист ва он дар кадом намудҳо пайдо мешавад?
Фишурдани тасвир раванди табдил додани тасвир аст, то ки он фазои камтарро ишғол кунад. Танҳо нигоҳ доштани тасвирҳо фазои зиёдеро ишғол мекунад, аз ин рӯ кодекҳо ба монанди JPEG ва PNG мавҷуданд, ки ҳадафи он кам кардани андозаи тасвири аслӣ мебошанд.
Тавре ки шумо медонед, ду намуди фишурдани тасвир вуҷуд дорад: талафот нест и бо талафот. Тавре ки аз номҳо бармеояд, фишурдани бе талаф метавонад маълумоти аслии тасвирро барқарор кунад, дар ҳоле ки фишурдани гумшуда дар вақти фишурда баъзе маълумотҳоро аз даст медиҳад. масалан, JPG алгоритмҳои гумшуда мебошанд [тақрибан. тарҷума - асосан, биёед дар бораи JPEG-и бе талаф фаромӯш накунем], ва PNG як алгоритми бе талафот аст.
Муқоисаи фишурдани бе талаф ва талафот
Аҳамият диҳед, ки тасвири дар тарафи рост мавҷудбуда асарҳои зиёде дорад. Ин маълумоти гумшуда аст. Пикселҳои ҳамсояи рангҳои шабеҳ ҳамчун як минтақа фишурда мешаванд, то ҷойгоҳ сарфа карда шаванд, аммо маълумот дар бораи пикселҳои воқеӣ гум мешавад. Албатта, алгоритмҳое, ки дар кодекҳои JPEG, PNG ва ғайра истифода мешаванд, хеле мураккабтаранд, аммо ин як намунаи хуби фишурдани талафот аст. Фишурдани бе талаф хуб аст, аммо файлҳои бе талаф фишурда фазои зиёди дискро ишғол мекунанд. Роҳҳои самараноктари фишурдани тасвирҳо бе талафоти зиёди иттилоот вуҷуд доранд, аммо онҳо хеле сустанд ва бисёриҳо равишҳои такрориро истифода мебаранд. Ин маънои онро дорад, ки онҳо наметавонанд дар як ядрои сершумори CPU ё GPU мувозӣ кор кунанд. Ин маҳдудият онҳоро барои истифодаи ҳамарӯза комилан ғайриимкон месозад.
Вуруди шабакаи нейронҳои конволютсионӣ
Агар чизеро ҳисоб кардан лозим бошад ва ҳисобҳо тахминӣ бошанд, илова кунед
меъморӣ
Муаллифон як шабакаи дугонаро пешниҳод карданд. Шабакаи аввал тасвирро ҳамчун вуруд мегирад ва намояндагии паймон (ComCNN) тавлид мекунад. Натиҷаи ин шабака баъдан тавассути кодеки стандартӣ (ба монанди JPEG) коркард мешавад. Пас аз коркарди кодек, тасвир ба шабакаи дуюм фиристода мешавад, ки тасвирро аз кодек бо кӯшиши баргардонидани тасвири аслӣ "ислоҳ" мекунад. Муаллифон ин шабакаро бозсозии CNN (RecCNN) номидаанд. Мисли GANҳо, ҳарду шабака ба таври такрорӣ омӯзонида мешаванд.
Намояндагии ComCNN Compact ба кодеки стандартӣ интиқол дода мешавад
RecCNN. Натиҷаи ComCNN такмил дода мешавад ва ба RecCNN дода мешавад, ки кӯшиш мекунад боқимондаашро омӯзад
Натиҷаи кодек такмил дода мешавад ва сипас ба RecCNN дода мешавад. RecCNN кӯшиш хоҳад кард, ки тасвире ба қадри имкон ба аслӣ монанд бошад.
Чаҳорчӯбаи фишурдасозии тасвир аз охири ба охир. Co(.) алгоритми фишурдани тасвир аст. Муаллифон JPEG, JPEG2000 ва BPG-ро истифода бурданд
Боқимонда чист?
Қисми боқимондаро метавон ҳамчун як қадами пас аз коркард барои "такмил додани" тасвири рамзкушоӣ аз ҷониби кодек баррасӣ кард. Бо миқдори зиёди "маълумот" дар бораи ҷаҳон, як шабакаи нейрон метавонад дар бораи ислоҳ кардани он қарорҳои маърифатӣ қабул кунад. Ин идея ба он асос ёфтааст
Функсияҳои талафот
Ду функсияи талафот истифода мешаванд, зеро мо ду шабакаи нейрон дорем. Аввалин аз онҳо, ComCNN, L1 нишон дода шудааст ва ба таври зерин муайян карда мешавад:
Функсияи талафот барои ComCNN
Шарҳ
Ин муодила метавонад мураккаб ба назар расад, аммо он дар асл стандартӣ аст (хатои миёнаи квадратӣ) MSE. ||² маънои меъёри вектореро, ки онҳо иҳота мекунанд.
Муодилаи 1.1
Cr баромади ComCNN-ро ифода мекунад. θ қобилияти омӯзиши параметрҳои ComCNN-ро ифода мекунад, XK тасвири воридотӣ мебошад
Муодилаи 1.2
Re()
барои RecCNN рост меояд. Ин муодила танҳо арзиши муодилаи 1.1-ро ба RecCNN мегузарад. θ параметрҳои омӯзишшавандаи RecCNN-ро ифода мекунад (сарпӯши боло маънои онро дорад, ки параметрҳо собит шудаанд).
Таърифи интуитивӣ
Муодилаи 1.0 ComCNN-ро маҷбур мекунад, ки вазнҳояшро тағир диҳад, то ҳангоми азнавсозӣ бо истифода аз RecCNN, тасвири ниҳоӣ то ҳадди имкон ба тасвири воридшуда монанд бошад. Функсияи дуюми талафоти RecCNN ба таври зерин муайян карда мешавад:
Муодилаи 2.0
Шарҳ
Боз ин функсия метавонад мураккаб ба назар расад, аммо он дар аксар маврид функсияи стандартии талафоти шабакаи нейронӣ (MSE) мебошад.
Муодилаи 2.1
Co()
маънои баромади кодек, x бо сарпӯши боло маънои баромади ComCNN. θ2 параметрҳои таълимшавандаи RecCNN мебошанд, res()
ин танҳо натиҷаи боқимондаи RecCNN аст. Бояд қайд кард, ки RecCNN дар бораи фарқияти байни Co() ва тасвири воридотӣ омӯзонида шудааст, аммо на дар тасвири вуруд.
Таърифи интуитивӣ
Муодилаи 2.0 RecCNN-ро маҷбур мекунад, ки вазнҳои худро тағир диҳад, то натиҷа ба тасвири воридотӣ то ҳадди имкон монанд бошад.
Схемаи таълим
Моделҳо ба таври такрорӣ омӯзонида мешаванд, ба монанди
Санҷишҳо
Муаллифон усули худро бо усулҳои мавҷуда, аз ҷумла кодекҳои оддӣ муқоиса карданд. Усули онҳо нисбат ба дигарон беҳтар кор мекунад ва суръати баландро дар сахтафзори мувофиқ нигоҳ медорад. Илова бар ин, муаллифон кӯшиш карданд, ки танҳо яке аз ин ду шабакаро истифода баранд ва коҳиши иҷроишро қайд карданд.
Муқоисаи шохиси шабоҳати сохторӣ (SSIM). Арзишҳои баланд шабеҳи беҳтар ба аслро нишон медиҳанд. Натичахои кори муаллифон бо харфи гафс нишон дода шудаанд.
хулоса
Мо роҳи нави истифодаи омӯзиши амиқро барои фишурдани тасвир дида баромадем ва дар бораи имкони истифодаи шабакаҳои нейрон дар вазифаҳои берун аз "умумӣ", ба монанди таснифоти тасвирҳо ва коркарди забон сӯҳбат кардем. Ин усул на танхо аз талаботи хозира кам нест, балки имкон медихад, ки тасвирхо хеле тезтар кор карда шаванд.
Омӯзиши шабакаҳои нейрон осонтар шуд, зеро мо махсусан барои сокинони Хабра як рамзи таблиғотро таҳия кардем ХАБР, додани 10% тахфифи иловагӣ ба тахфифи дар баннер нишондодашуда.
Таълими касби маълумот аз сифр Online Bootcamp Омӯзиши касби таҳлилгари маълумот аз сифр Online Bootcamp Analytics Data Курси Python барои рушди веб
Курсҳои бештар
Курси таҳлили маълумот Курси DevOps Касби таҳиягари веб Таҳиягари iOS аз сифр Касби таҳиягари Android аз сифр Касби таҳиягари Java аз сифр Курси JavaScript Курси омӯзиши мошинҳо Курси "Математика ва омӯзиши мошинсозӣ барои илми маълумот" Курси такмили ихтисос "Machine Learning Pro + Deep Learning"
Мақолаҳои пешниҳодшуда
Чӣ тавр бе курсҳои онлайн олими маълумот шудан мумкин аст 450 Курсҳои ройгони Лигаи Айви Чӣ тавр омӯзиши мошинро 5 рӯз дар як ҳафта дар тӯли 9 моҳ пай дар пай омӯзед Таҳлилгари маълумот чӣ қадар маош мегирад: шарҳи маош ва ҷойҳои холӣ дар Русия ва хориҷа дар соли 2020 Омӯзиши мошинсозӣ ва биниши компютерӣ дар саноати кӯҳӣ
Манбаъ: will.com