మెషిన్ లెర్నింగ్ పద్ధతులను ఉపయోగించి వీడియో స్ట్రీమ్‌లో ట్యాంకులను గుర్తించడం (ఎల్బ్రస్ మరియు బైకాల్ ప్లాట్‌ఫారమ్‌లపై +2 వీడియోలు)

మెషిన్ లెర్నింగ్ పద్ధతులను ఉపయోగించి వీడియో స్ట్రీమ్‌లో ట్యాంకులను గుర్తించడం (ఎల్బ్రస్ మరియు బైకాల్ ప్లాట్‌ఫారమ్‌లపై +2 వీడియోలు)

మా కార్యకలాపాల సమయంలో, మేము ప్రతిరోజూ అభివృద్ధి ప్రాధాన్యతలను నిర్ణయించే సమస్యను ఎదుర్కొంటాము. ఐటి పరిశ్రమ అభివృద్ధి యొక్క అధిక డైనమిక్స్, కొత్త టెక్నాలజీల కోసం వ్యాపారం మరియు ప్రభుత్వం నుండి నిరంతరం పెరుగుతున్న డిమాండ్, మేము అభివృద్ధి యొక్క వెక్టర్‌ను నిర్ణయించిన ప్రతిసారీ మరియు మా కంపెనీ యొక్క శాస్త్రీయ సామర్థ్యంలో మా స్వంత శక్తులు మరియు నిధులను పెట్టుబడి పెట్టడం వంటివి పరిగణనలోకి తీసుకుంటాము. మా పరిశోధన మరియు ప్రాజెక్టులన్నీ ప్రాథమిక మరియు ఇంటర్ డిసిప్లినరీ స్వభావం.

అందువల్ల, మా ప్రధాన సాంకేతికత - హైరోగ్లిఫ్ డేటా గుర్తింపు ఫ్రేమ్‌వర్క్‌ని అభివృద్ధి చేయడం ద్వారా, డాక్యుమెంట్ రికగ్నిషన్ (మా ప్రధాన వ్యాపార శ్రేణి) నాణ్యతను మెరుగుపరచడం మరియు సంబంధిత గుర్తింపు సమస్యలను పరిష్కరించడానికి సాంకేతికతను ఉపయోగించే అవకాశం రెండింటి గురించి మేము ఆందోళన చెందుతున్నాము. నేటి కథనంలో, మా గుర్తింపు ఇంజిన్ (పత్రాలు) ఆధారంగా మేము వీడియో స్ట్రీమ్‌లో పెద్ద, వ్యూహాత్మకంగా ముఖ్యమైన వస్తువులను ఎలా గుర్తించాలో మీకు తెలియజేస్తాము.

సమస్య యొక్క ప్రకటన

ఇప్పటికే ఉన్న డెవలప్‌మెంట్‌లను ఉపయోగించి, ట్యాంక్ రికగ్నిషన్ సిస్టమ్‌ను రూపొందించండి, ఇది ఒక వస్తువును వర్గీకరించడాన్ని సాధ్యం చేస్తుంది, అలాగే ప్రత్యేక పరికరాలను ఉపయోగించకుండా పేలవంగా నియంత్రించబడిన పరిస్థితులలో ప్రాథమిక రేఖాగణిత సూచికలను (ధోరణి మరియు దూరం) నిర్ణయించండి.

నిర్ణయం

సమస్యను పరిష్కరించడానికి మేము స్టాటిస్టికల్ మెషీన్ లెర్నింగ్ విధానాన్ని ప్రధాన అల్గారిథమ్‌గా ఎంచుకున్నాము. కానీ మెషిన్ లెర్నింగ్ యొక్క ముఖ్య సమస్యలలో ఒకటి తగినంత మొత్తంలో శిక్షణ డేటాను కలిగి ఉండటం. సహజంగానే, మనకు అవసరమైన వస్తువులతో కూడిన వాస్తవ దృశ్యాల నుండి పొందిన సహజ చిత్రాలు మనకు అందుబాటులో ఉండవు. అందువల్ల, అదృష్టవశాత్తూ, శిక్షణ కోసం అవసరమైన డేటాను రూపొందించడాన్ని ఆశ్రయించాలని నిర్ణయించారు ఈ స్థలంలో మాకు చాలా అనుభవం ఉంది. ఇంకా, ఈ పని కోసం డేటాను పూర్తిగా సంశ్లేషణ చేయడం మాకు అసహజంగా అనిపించింది, కాబట్టి నిజమైన దృశ్యాలను అనుకరించడానికి ప్రత్యేక లేఅవుట్ తయారు చేయబడింది. మోడల్ గ్రామీణ ప్రాంతాలను అనుకరించే వివిధ వస్తువులను కలిగి ఉంది: లక్షణమైన ప్రకృతి దృశ్యం, పొదలు, చెట్లు, కంచెలు మొదలైనవి. చిన్న ఫార్మాట్ డిజిటల్ కెమెరాను ఉపయోగించి చిత్రాలు తీయబడ్డాయి. ఇమేజ్ క్యాప్చర్ ప్రక్రియలో, నేపథ్య మార్పులకు అల్గారిథమ్‌లను మరింత పటిష్టంగా చేయడానికి సన్నివేశం యొక్క నేపథ్యం గణనీయంగా మారింది.

మెషిన్ లెర్నింగ్ పద్ధతులను ఉపయోగించి వీడియో స్ట్రీమ్‌లో ట్యాంకులను గుర్తించడం (ఎల్బ్రస్ మరియు బైకాల్ ప్లాట్‌ఫారమ్‌లపై +2 వీడియోలు)

లక్ష్య వస్తువులు 4 యుద్ధ ట్యాంకుల నమూనాలు: T-90 (రష్యా), M1A2 అబ్రమ్స్ (USA), T-14 (రష్యా), మెర్కవా III (ఇజ్రాయెల్). వస్తువులు బహుభుజి యొక్క వివిధ స్థానాల్లో ఉన్నాయి, తద్వారా వస్తువు యొక్క ఆమోదయోగ్యమైన కనిపించే కోణాల జాబితాను విస్తరిస్తుంది. ఇంజనీరింగ్ అడ్డంకులు, చెట్లు, పొదలు మరియు ఇతర ప్రకృతి దృశ్యం అంశాలు ముఖ్యమైన పాత్ర పోషించాయి.

మెషిన్ లెర్నింగ్ పద్ధతులను ఉపయోగించి వీడియో స్ట్రీమ్‌లో ట్యాంకులను గుర్తించడం (ఎల్బ్రస్ మరియు బైకాల్ ప్లాట్‌ఫారమ్‌లపై +2 వీడియోలు)

ఈ విధంగా, రెండు రోజులలో మేము శిక్షణ మరియు అల్గోరిథం యొక్క నాణ్యత యొక్క తదుపరి మూల్యాంకనం కోసం తగినంత సెట్‌ను సేకరించాము (అనేక పదివేల చిత్రాలు).

వారు గుర్తింపును రెండు భాగాలుగా విభజించాలని నిర్ణయించుకున్నారు: వస్తువు స్థానికీకరణ మరియు ఆబ్జెక్ట్ వర్గీకరణ. శిక్షణ పొందిన వియోలా మరియు జోన్స్ వర్గీకరణను ఉపయోగించి స్థానికీకరణ నిర్వహించబడింది (అన్నింటికంటే, ట్యాంక్ ఒక సాధారణ దృఢమైన వస్తువు, ముఖం కంటే అధ్వాన్నంగా ఉండదు, కాబట్టి వియోలా మరియు జోన్స్ యొక్క “వివరంగా-బ్లైండ్” పద్ధతి లక్ష్య వస్తువును త్వరగా స్థానికీకరిస్తుంది). కానీ మేము కోణం యొక్క వర్గీకరణ మరియు నిర్ణయాన్ని కన్వల్యూషనల్ న్యూరల్ నెట్‌వర్క్‌కు అప్పగించాము - ఈ పనిలో డిటెక్టర్ మెర్కావా నుండి T-90ని వేరు చేసే లక్షణాలను విజయవంతంగా గుర్తించడం మాకు ముఖ్యం. ఫలితంగా, అదే రకమైన వస్తువుల స్థానికీకరణ మరియు వర్గీకరణ సమస్యను విజయవంతంగా పరిష్కరించే అల్గోరిథంల యొక్క సమర్థవంతమైన కూర్పును నిర్మించడం సాధ్యమైంది.

మెషిన్ లెర్నింగ్ పద్ధతులను ఉపయోగించి వీడియో స్ట్రీమ్‌లో ట్యాంకులను గుర్తించడం (ఎల్బ్రస్ మరియు బైకాల్ ప్లాట్‌ఫారమ్‌లపై +2 వీడియోలు)

తర్వాత, మేము ఇప్పటికే ఉన్న మా అన్ని ప్లాట్‌ఫారమ్‌లలో (Intel, ARM, Elbrus, Baikal, KOMDIV) ఫలిత ప్రోగ్రామ్‌ను ప్రారంభించాము, పనితీరును పెంచడానికి గణనపరంగా కష్టతరమైన అల్గారిథమ్‌లను ఆప్టిమైజ్ చేసాము (దీని గురించి మేము ఇప్పటికే మా కథనాలలో చాలాసార్లు వ్రాసాము, ఉదాహరణకు ఇక్కడ https://habr.com/ru/company/smartengines/blog/438948/ లేదా https://habr.com/ru/company/smartengines/blog/351134/) మరియు నిజ సమయంలో పరికరంలో ప్రోగ్రామ్ యొక్క స్థిరమైన ఆపరేషన్‌ను సాధించింది.


వివరించిన అన్ని చర్యల ఫలితంగా, మేము ముఖ్యమైన వ్యూహాత్మక మరియు సాంకేతిక లక్షణాలతో పూర్తి స్థాయి సాఫ్ట్‌వేర్ ఉత్పత్తిని పొందాము.

స్మార్ట్ ట్యాంక్ రీడర్

కాబట్టి, మేము మా కొత్త అభివృద్ధిని మీకు అందిస్తున్నాము - వీడియో స్ట్రీమ్‌లో ట్యాంకుల చిత్రాలను గుర్తించే ప్రోగ్రామ్ స్మార్ట్ ట్యాంక్ రీడర్, ఇది:

మెషిన్ లెర్నింగ్ పద్ధతులను ఉపయోగించి వీడియో స్ట్రీమ్‌లో ట్యాంకులను గుర్తించడం (ఎల్బ్రస్ మరియు బైకాల్ ప్లాట్‌ఫారమ్‌లపై +2 వీడియోలు)

  • ఇచ్చిన వస్తువుల సెట్ కోసం "స్నేహితుడు లేదా శత్రువు" సమస్యను నిజ సమయంలో పరిష్కరిస్తుంది;
  • రేఖాగణిత పారామితులను నిర్ణయిస్తుంది (వస్తువుకు దూరం, వస్తువు యొక్క ప్రాధాన్యత ధోరణి);
  • అనియంత్రిత వాతావరణ పరిస్థితులలో, అలాగే విదేశీ వస్తువుల ద్వారా వస్తువును పాక్షికంగా నిరోధించే సందర్భంలో పనిచేస్తుంది;
  • రేడియో కమ్యూనికేషన్ లేకపోవడంతో సహా లక్ష్య పరికరంలో పూర్తిగా స్వయంప్రతిపత్త ఆపరేషన్;
  • మద్దతు ఉన్న ప్రాసెసర్ ఆర్కిటెక్చర్ల జాబితా: ఎల్బ్రస్, బైకాల్, కోమ్డివివ్, అలాగే x86, x86_64, ARM;
  • మద్దతు ఉన్న ఆపరేటింగ్ సిస్టమ్‌ల జాబితా: Elbrus OS, AstraLinux OS, Atlix OS, అలాగే MS Windows, macOS, gcc 4.8, Android, iOSకి మద్దతు ఇచ్చే వివిధ Linux పంపిణీలు;
  • పూర్తిగా దేశీయ అభివృద్ధి.

సాధారణంగా, హాబ్రేపై మా కథనాల ముగింపులో, మేము మార్కెట్‌ప్లేస్‌కి లింక్‌ను అందిస్తాము, ఇక్కడ ఎవరైనా తమ మొబైల్ ఫోన్‌ని ఉపయోగిస్తున్నప్పుడు సాంకేతికత పనితీరును వాస్తవంగా అంచనా వేయడానికి అప్లికేషన్ యొక్క డెమో వెర్షన్‌ను డౌన్‌లోడ్ చేసుకోవచ్చు. ఈసారి, ఫలిత అప్లికేషన్ యొక్క ప్రత్యేకతలను పరిగణనలోకి తీసుకుంటే, ట్యాంక్ ఒక నిర్దిష్ట వైపుకు చెందినదా అని త్వరగా నిర్ణయించే సమస్యను మా పాఠకులందరూ వారి జీవితంలో ఎప్పుడూ ఎదుర్కోకూడదని మేము కోరుకుంటున్నాము.

మూలం: www.habr.com

ఒక వ్యాఖ్యను జోడించండి