FairMOT, வீடியோவில் பல பொருட்களை விரைவாகக் கண்காணிப்பதற்கான அமைப்பு

மைக்ரோசாப்ட் மற்றும் மத்திய சீனா பல்கலைக்கழக ஆராய்ச்சியாளர்கள் உருவாக்கப்பட்டது இயந்திர கற்றல் தொழில்நுட்பங்களைப் பயன்படுத்தி வீடியோவில் பல பொருட்களைக் கண்காணிப்பதற்கான ஒரு புதிய உயர் செயல்திறன் முறை - FairMOT (Fair Multi-Object Tracking). Pytorch மற்றும் பயிற்சியளிக்கப்பட்ட மாதிரிகள் அடிப்படையில் முறை செயல்படுத்தல் கொண்ட குறியீடு வெளியிடப்பட்டது GitHub இல்.

தற்போதுள்ள பெரும்பாலான பொருள் கண்காணிப்பு முறைகள் இரண்டு நிலைகளைப் பயன்படுத்துகின்றன, அவை ஒவ்வொன்றும் தனித்தனி நரம்பியல் நெட்வொர்க்கால் செயல்படுத்தப்படுகின்றன. முதல் நிலை ஆர்வமுள்ள பொருட்களின் இருப்பிடத்தைத் தீர்மானிப்பதற்கான ஒரு மாதிரியை இயக்குகிறது, மேலும் இரண்டாவது கட்டத்தில் பொருள்களை மீண்டும் அடையாளம் காணவும் அவற்றுடன் நங்கூரங்களை இணைக்கவும் பயன்படுத்தப்படும் ஒரு சங்கத் தேடல் மாதிரியைப் பயன்படுத்துகிறது.

FairMOT ஒரு சிதைந்த கன்வல்யூஷனல் நியூரல் நெட்வொர்க்கை அடிப்படையாகக் கொண்ட ஒரு-நிலை செயலாக்கத்தைப் பயன்படுத்துகிறது (DCNv2, சிதைக்கக்கூடிய கன்வல்யூஷனல் நெட்வொர்க்), இது பொருள் கண்காணிப்பின் வேகத்தில் குறிப்பிடத்தக்க அதிகரிப்பை அடைய உங்களை அனுமதிக்கிறது. FairMOT நங்கூரங்கள் இல்லாமல் செயல்படுகிறது, ஒரு உயர் துல்லியமான பொருள் வரைபடத்தில் பொருள் மையங்களின் ஆஃப்செட்களைத் தீர்மானிக்க மறு-அடையாளம் பொறிமுறையைப் பயன்படுத்துகிறது. இணையாக, ஒரு செயலி செயல்படுத்தப்படுகிறது, இது பொருள்களின் அடையாளத்தை கணிக்கப் பயன்படும் தனிப்பட்ட அம்சங்களை மதிப்பிடுகிறது, மேலும் முக்கிய தொகுதி வெவ்வேறு அளவுகளின் பொருட்களைக் கையாள இந்த அம்சங்களின் ஒருங்கிணைப்பை செய்கிறது.

FairMOT, வீடியோவில் பல பொருட்களை விரைவாகக் கண்காணிப்பதற்கான அமைப்பு

FairMOT இல் மாதிரியைப் பயிற்றுவிக்க, மக்களைக் கண்டறிதல் மற்றும் தேடலுக்கான ஆறு பொது தரவுத்தொகுப்புகளின் கலவை பயன்படுத்தப்பட்டது (ETH, CityPerson, CalTech, MOT17, CUHK-SYSU). வீடியோக்களின் சோதனைத் தொகுப்புகளைப் பயன்படுத்தி மாதிரி சோதிக்கப்பட்டது 2DMOT15, MOT16, MOT17 и MOT20திட்டத்தால் வழங்கப்படுகிறது MOT சவால் மற்றும் வெவ்வேறு சூழ்நிலைகள், கேமரா இயக்கம் அல்லது சுழற்சி, வெவ்வேறு கோணங்கள் ஆகியவற்றை உள்ளடக்கியது. என்று சோதனை காட்டியது
FairMOT வெளிப்புறங்கள் வேகமான போட்டி மாதிரிகள் TrackRCNN и ஜே.டி.இ. வினாடிக்கு 30 பிரேம்கள் வீடியோ ஸ்ட்ரீம்களில் சோதிக்கப்படும் போது, ​​வழக்கமான வீடியோ ஸ்ட்ரீம்களை பறக்கும்போது பகுப்பாய்வு செய்ய போதுமான செயல்திறனை வெளிப்படுத்துகிறது.

ஆதாரம்: opennet.ru

கருத்தைச் சேர்