HyperStyle - aðlögun StyleGAN vélanámskerfisins fyrir myndvinnslu

Hópur vísindamanna frá Tel Aviv háskólanum kynnti HyperStyle, öfuga útgáfu af StyleGAN2 vélanámskerfi NVIDIA sem er endurhannað til að endurskapa þá hluta sem vantar þegar raunverulegum myndum er breytt. Kóðinn er skrifaður í Python með PyTorch ramma og er dreift undir MIT leyfinu.

Ef StyleGAN gerir þér kleift að búa til raunhæft útlit ný andlit fólks með því að tilgreina breytur eins og aldur, kyn, hárlengd, bros eðli, lögun nefs, húðlit, gleraugu og ljósmyndahorn, þá gerir HyperStyle það mögulegt að breyta svipuðum breytum í núverandi ljósmyndir án þess að breyta einkennandi eiginleikum þeirra á sama tíma og upprunalega andlitið er þekkt. Til dæmis, með því að nota HyperStyle, geturðu líkt eftir breytingu á aldri einstaklings á mynd, breytt hárgreiðslu, bætt við gleraugu, skeggi eða yfirvaraskeggi, gefið myndinni útlit teiknimyndapersónu eða handteiknað málverk, gert sorglegt eða glaðlegt andlitssvip. Þar að auki er hægt að þjálfa kerfið ekki aðeins til að breyta andliti fólks heldur einnig fyrir hvaða hluti sem er, til dæmis til að breyta myndum af bílum.

HyperStyle - aðlögun StyleGAN vélanámskerfisins fyrir myndvinnslu

Fyrirhuguð aðferð miðar að því að leysa vandamálið við að endurgera hluta myndarinnar sem vantar meðan á klippingu stendur. Í áður fyrirhuguðum aðferðum var skiptingin á milli endurbyggingar og breytanleika leyst með því að fínstilla myndavélina til að skipta út hluta markmyndarinnar þegar upphaflega vantaði breytanleg svæði voru endurgerð. Ókosturinn við slíkar aðferðir er þörfin fyrir markvissa langtímaþjálfun á taugakerfi fyrir hverja mynd.

Aðferðin sem byggir á StyleGAN reikniritinu gerir það mögulegt að nota staðlað líkan, fyrirfram þjálfað á algengum myndasöfnum, til að búa til þætti sem eru einkennandi fyrir upprunalegu myndina með áreiðanleikastigi sem er sambærilegt við reiknirit sem krefjast einstakrar þjálfunar líkansins fyrir hverja mynd. Annar kostur nýju aðferðarinnar er hæfileikinn til að breyta myndum með frammistöðu nálægt rauntíma.

HyperStyle - aðlögun StyleGAN vélanámskerfisins fyrir myndvinnslu

Tilbúnar þjálfaðar gerðir eru útbúnar fyrir andlit fólks, bíla og dýra út frá söfnunum Flickr-Faces-HQ (FFHQ, 70 þúsund hágæða PNG myndir af andlitum fólks), Stanford Cars (16 þúsund myndir af bílum) og AFHQ (myndir af dýrum). Að auki eru tól til að þjálfa módel þín, svo og tilbúnar þjálfaðar gerðir af stöðluðum kóðara og rafala sem henta til notkunar með þeim. Til dæmis eru rafala í boði til að búa til myndir í Toonify-stíl, Pixar persónur, búa til skissur og jafnvel stílisera prinsessur úr Disney teiknimyndum.

HyperStyle - aðlögun StyleGAN vélanámskerfisins fyrir myndvinnslu
HyperStyle - aðlögun StyleGAN vélanámskerfisins fyrir myndvinnslu
HyperStyle - aðlögun StyleGAN vélanámskerfisins fyrir myndvinnslu
HyperStyle - aðlögun StyleGAN vélanámskerfisins fyrir myndvinnslu


Heimild: opennet.ru

Bæta við athugasemd