Hodiaŭ, por multaj, forigi interferan elementon de foto ne plu estas problemo. Bazaj kapabloj en Photoshop aŭ la hodiaŭaj modaj neŭralaj retoj povas solvi la problemon. Tamen, en la kazo de video, la situacio fariĝas pli komplika, ĉar vi devas prilabori almenaŭ 24 kadrojn por sekundo de video.
Kaj jen ĝi estas sur Github
La sistemo uzas neŭralan reton, kiu prilaboras la videokadron post kadro, anstataŭigante nenecesan objekton aŭ personon per la fono. La programo povas ŝanĝi ĝis 55 kadrojn sekundo, konstruante la fonon bazitan sur la ĉirkaŭa bildo. Kvankam post pli proksima inspektado evidentiĝas, ke la objekta forigo-metodo estas malproksima de perfekta, la rezultoj estas imponaj.
Kelkaj kadroj montras ke travidebla aŭ diafana fantoma spuro restas anstataŭ la "forigita" persono. La fakto estas, ke la sistemo analizas nur la disponeblan fonon kaj ne ĉiam kapablas taŭge desegni ĝin. Ĝi dependas de la komplekseco de la fono - ju pli simpla kaj uniforma ĝi estas, des pli bona la fina rezulto.
Por testado, la OS uzita estis Ubuntu 16.04, Python 3.5, Pytorch 0.4.0, CUDA 8.0, kaj prilaborado estis farita sur NVIDIA GeForce GTX 1080 Ti vidkarto. La fontoj mem estas malfermitaj kaj povas esti uzataj de ĉiuj. Tamen ni rimarkas, ke tia teknologio ankaŭ povas esti uzata por malicaj celoj. Ekzemple, por "kaŝi" trafikajn malobservojn aŭ aliajn krimojn kaptitajn per fotilo.
fonto: 3dnews.ru