Өнөөдөр олон хүний хувьд гэрэл зураг дээрх хөндлөнгийн элементийг арилгах нь асуудал байхаа больсон. Өнөөдөр Photoshop эсвэл моод мэдрэлийн сүлжээний үндсэн ур чадвар нь асуудлыг шийдэж чадна. Гэсэн хэдий ч видео бичлэгийн хувьд нөхцөл байдал төвөгтэй байдаг, учир нь та секундэд дор хаяж 24 фрэйм видеог боловсруулах шаардлагатай болдог.
Мөн энд Github дээр
Уг систем нь мэдрэлийн сүлжээг ашиглан видео кадрыг кадр болгон боловсруулж, шаардлагагүй объект эсвэл хүнийг дэвсгэрээр сольдог. Хөтөлбөр нь секундэд 55 хүртэлх фрэймийг өөрчлөх боломжтой бөгөөд эргэн тойрны зураг дээр тулгуурлан дэвсгэр зургийг дуусгах боломжтой. Хэдийгээр сайтар шалгаж үзэхэд объектыг зайлуулах арга нь төгс биш болох нь тодорхой болсон ч үр дүн нь гайхалтай юм.
Зарим хүрээ нь "алслагдсан" хүний оронд ил тод эсвэл тунгалаг хий үзэгдэл үлддэг болохыг харуулж байна. Үнэн хэрэгтээ систем нь зөвхөн боломжтой дэвсгэр дээр дүн шинжилгээ хийдэг бөгөөд өнөөг хүртэл үүнийг үргэлж хангалттай дуусгаж чаддаггүй. Энэ нь арын дэвсгэрийн нарийн төвөгтэй байдлаас шалтгаална - энэ нь илүү энгийн бөгөөд жигд байх тусам эцсийн үр дүн илүү сайн байх болно.
Туршилтын хувьд бид Ubuntu 16.04, Python 3.5, Pytorch 0.4.0, CUDA 8.0-ийг ашигласан бөгөөд боловсруулалтыг NVIDIA GeForce GTX 1080 Ti видео карт дээр хийсэн. Эх сурвалжууд нь өөрөө нээлттэй бөгөөд хүн бүр ашиглах боломжтой. Үүний зэрэгцээ энэ технологийг хортой зорилгоор ашиглаж болно гэдгийг бид тэмдэглэж байна. Тухайлбал, камерын дуранд өртсөн замын хөдөлгөөний дүрэм зөрчсөн болон бусад гэмт хэргийг “нуух”.
Эх сурвалж: 3dnews.ru