Стабилити АИ је објавио модел машинског учења под називом Стабле Видео Диффусион који може да генерише кратке видео записе из слика. Модел проширује могућности пројекта Стабле Диффусион, раније ограниченог на синтезу статичних слика. Код за обуку неуронске мреже и алате за генерисање слика је написан у Питхон-у користећи ПиТорцх оквир и објављен под МИТ лиценцом. Већ обучени модели су отворени под дозвољеном Цреативе МЛ ОпенРАИЛ-М лиценцом, што омогућава комерцијалну употребу.
Постоје две опције модела доступне за преузимање: СВД (Стабле Видео Диффусион) за генерисање 14 кадрова са резолуцијом од 576к1024 на основу дате статичне слике и СВД-КСТ за генерисање 25 кадрова. Могуће је генерисати видео без покрета или са веома спором ротацијом камере, у трајању до 4 секунде. Директна контрола модела заснована на текстуалном опису на природном језику још увек није подржана, али прво можете припремити оригиналну слику користећи стари модел Стабле Диффусион 2.1, а затим је конвертовати у видео користећи СВД модел.
Квалитет видеа још увек не пружа идеалан фотореализам и гарантовано исправно приказивање лица и људи. У погледу перформанси, предложени отворени модел је испред сопствених аналога компаније Рунваи и Пика Лабс. Модел се лако може прилагодити за решавање различитих проблема, на пример, може се користити за формирање тродимензионалних фигура.

Поред тога, можемо приметити објављивање видео-ЛЛаВА алата за машинско учење, који вам омогућава да креирате јединствену визуелну представу објекта, формирану на основу истовременог коришћења фотографија и видео снимака објеката током тренинга. Систем се може користити, на пример, за препознавање присуства истих објеката на сликама и видео записима. Код је написан у Питхон-у и дистрибуира се под лиценцом Апацхе 2.0.
Извор: опеннет.ру
