FairMOT, kerfi til að fylgjast fljótt með mörgum hlutum á myndbandi

Vísindamenn frá Microsoft og Central China University þróað ný afkastamikil aðferð til að rekja marga hluti í myndbandi með því að nota vélanámstækni - FairMOT (Fair Multi-Object Tracking). Kóði með aðferðaútfærslu byggt á Pytorch og þjálfuðum líkönum birt á GitHub.

Flestar núverandi mælingaraðferðir nota tvö þrep, hvert útfært af sérstöku taugakerfi. Fyrsta þrepið keyrir líkan til að ákvarða staðsetningu áhugaverðra hluta og annað stig notar samtakaleitarlíkan til að endurgreina hluti og festa akkeri við þá.

FairMOT notar eins þrepa útfærslu sem byggir á aflögunarhæfu snúnings taugakerfi (DCNv2, Deformable Convolutional Network), sem gerir þér kleift að ná áberandi aukningu á hraða mælingar á hlutum. FairMOT vinnur án akkeris og notar endurauðkenningarkerfi til að ákvarða offset miðpunkta hluta á nákvæmu korti hluta. Samhliða er keyrður örgjörvi sem metur einstaka eiginleika hluta sem hægt er að nota til að spá fyrir um auðkenni þeirra og aðaleiningin framkvæmir sameiningu þessara eiginleika til að vinna með hluti af mismunandi mælikvarða.

FairMOT, kerfi til að fylgjast fljótt með mörgum hlutum á myndbandi

Til að þjálfa líkanið í FairMOT var notuð samsetning af sex opinberum gagnasöfnum fyrir uppgötvun og leit fólks (ETH, CityPerson, CalTech, MOT17, CUHK-SYSU). Líkanið var prófað með því að nota prófunarsett af myndböndum 2DMOT15, MOT16, MOT17 и MOT20sem verkefnið veitir MOT áskorun og fjallar um mismunandi aðstæður, hreyfingar myndavélar eða snúningur, mismunandi sjónarhorn. Prófunin sýndi það
FairMOT framúrskarandi hraðskreiðasta módel í samkeppni TrackRCNN и J.D.E. þegar það er prófað á 30 ramma á sekúndu myndbandsstraumum, sem sýnir frammistöðu sem nægir til að greina venjulega myndbandsstrauma á flugi.

Heimild: opennet.ru

Bæta við athugasemd