FairMOT, videodaki birden fazla nesneyi hızla izlemeye yönelik bir sistem

Microsoft ve Orta Çin Üniversitesi'nden araştırmacılar geliştirdi makine öğrenimi teknolojilerini kullanarak videodaki birden fazla nesneyi izlemek için yeni, yüksek performanslı bir yöntem - FairMOT (Fair Multi-Object Tracking). Pytorch ve eğitimli modellere dayalı yöntem uygulamasına sahip kod yayınlanan GitHub'da.

Mevcut nesne izleme yöntemlerinin çoğu, her biri ayrı bir sinir ağı tarafından uygulanan iki aşamayı kullanır. İlk aşamada ilgilenilen nesnelerin konumunu belirlemek için bir model çalıştırılır ve ikinci aşamada nesneleri yeniden tanımlamak ve onlara bağlantı noktaları eklemek için kullanılan bir ilişkilendirme arama modeli kullanılır.

FairMOT, deforme olabilen evrişimli bir sinir ağını temel alan tek aşamalı bir uygulama kullanır (DCNv2, Deforme Edilebilir Evrişimli Ağ), nesne izleme hızında gözle görülür bir artış elde etmenizi sağlar. FairMOT, yüksek hassasiyetli bir nesne haritasında nesne merkezlerinin uzaklıklarını belirlemek için bir yeniden tanımlama mekanizması kullanarak çapalar olmadan çalışır. Buna paralel olarak, nesnelerin kimliklerini tahmin etmek için kullanılabilecek bireysel özelliklerini değerlendiren bir işlemci yürütülür ve ana modül, farklı ölçeklerdeki nesneleri işlemek için bu özelliklerin yakınsamasını gerçekleştirir.

FairMOT, videodaki birden fazla nesneyi hızla izlemeye yönelik bir sistem

Modeli FairMOT'ta eğitmek için, kişi tespiti ve aramaya yönelik altı genel veri kümesinin bir kombinasyonu kullanıldı (ETH, CityPerson, CalTech, MOT17, CUHK-SYSU). Model, test video setleri kullanılarak test edildi 2DMOT15, MOT16, MOT17 и MOT20proje tarafından sağlanan Muayene Mücadelesi ve farklı durumları, kamera hareketini veya dönüşünü, farklı görüş açılarını kapsar. Test şunu gösterdi
AdilMOT önde en hızlı rakip modeller ParçaRCNN и JDE Saniyede 30 karelik video akışlarında test edildiğinde, normal video akışlarını anında analiz etmek için yeterli performansı gösterir.

Kaynak: opennet.ru

Yorum ekle