FairMOT нь видеон дээрх олон объектыг хурдан хянах систем юм

Майкрософт болон Төв Хятадын их сургуулийн судлаачид боловсруулсан Машин сургалтын технологийг ашиглан видеон дээрх олон объектыг хянах өндөр гүйцэтгэлтэй шинэ арга - FairMOT (Fair Multi-Object Tracking). Pytorch болон бэлтгэгдсэн загварт суурилсан аргын хэрэгжилттэй код Нийтлэгдсэн GitHub дээр.

Одоо байгаа ихэнх объектыг хянах аргууд нь хоёр үе шатыг ашигладаг бөгөөд тус бүр нь тусдаа мэдрэлийн сүлжээгээр хэрэгждэг. Эхний шатанд сонирхсон объектын байршлыг тодорхойлох загварыг ажиллуулдаг бол хоёр дахь шатанд объектыг дахин таних, тэдгээрт зангуу холбоход ашигладаг холбоо хайлтын загварыг ашигладаг.

FairMOT нь хэв гажилттай нугалсан мэдрэлийн сүлжээнд суурилсан нэг үе шаттай хэрэгжилтийг ашигладаг.DCNv2, Deformable Convolutional Network) нь объектыг хянах хурдыг мэдэгдэхүйц нэмэгдүүлэх боломжийг олгодог. FairMOT нь өндөр нарийвчлалтай объектын газрын зураг дээрх объектын төвүүдийн офсетийг тодорхойлохын тулд дахин таних механизмыг ашиглан зангуугүйгээр ажилладаг. Үүний зэрэгцээ объектуудын хувийн шинж чанарыг урьдчилан таамаглах боломжтой процессорыг ажиллуулдаг бөгөөд үндсэн модуль нь янз бүрийн масштабтай объектуудыг удирдахын тулд эдгээр шинж чанаруудын нэгдлийг гүйцэтгэдэг.

FairMOT нь видеон дээрх олон объектыг хурдан хянах систем юм

Загварыг FairMOT-д сургахын тулд хүмүүсийг илрүүлэх, хайхад зориулагдсан зургаан нийтийн мэдээллийн багцыг хослуулан ашигласан (ETH, CityPerson, CalTech, MOT17, CUHK-SYSU). Загварыг туршилтын видео бичлэгийн багц ашиглан туршиж үзсэн 2DMOT15, MOT16, MOT17 и MOT20төслөөс олгосон MOT Challenge мөн өөр өөр нөхцөл байдал, камерын хөдөлгөөн эсвэл эргэлт, өөр өөр харах өнцгийг хамарна. Туршилт үүнийг харуулсан
FairMOT давсан хамгийн хурдан өрсөлдөж буй загварууд TrackRCNN и ЖДЭ секундэд 30 фрэймийн хурдтай видео урсгал дээр туршиж үзэхэд ердийн видео урсгалыг шууд шинжлэхэд хангалттай гүйцэтгэлийг харуулсан.

Эх сурвалж: opennet.ru

сэтгэгдэл нэмэх