మా కార్యకలాపాల సమయంలో, మేము ప్రతిరోజూ అభివృద్ధి ప్రాధాన్యతలను నిర్ణయించే సమస్యను ఎదుర్కొంటాము. ఐటి పరిశ్రమ అభివృద్ధి యొక్క అధిక డైనమిక్స్, కొత్త టెక్నాలజీల కోసం వ్యాపారం మరియు ప్రభుత్వం నుండి నిరంతరం పెరుగుతున్న డిమాండ్, మేము అభివృద్ధి యొక్క వెక్టర్ను నిర్ణయించిన ప్రతిసారీ మరియు మా కంపెనీ యొక్క శాస్త్రీయ సామర్థ్యంలో మా స్వంత శక్తులు మరియు నిధులను పెట్టుబడి పెట్టడం వంటివి పరిగణనలోకి తీసుకుంటాము. మా పరిశోధన మరియు ప్రాజెక్టులన్నీ ప్రాథమిక మరియు ఇంటర్ డిసిప్లినరీ స్వభావం.
అందువల్ల, మా ప్రధాన సాంకేతికత - హైరోగ్లిఫ్ డేటా గుర్తింపు ఫ్రేమ్వర్క్ని అభివృద్ధి చేయడం ద్వారా, డాక్యుమెంట్ రికగ్నిషన్ (మా ప్రధాన వ్యాపార శ్రేణి) నాణ్యతను మెరుగుపరచడం మరియు సంబంధిత గుర్తింపు సమస్యలను పరిష్కరించడానికి సాంకేతికతను ఉపయోగించే అవకాశం రెండింటి గురించి మేము ఆందోళన చెందుతున్నాము. నేటి కథనంలో, మా గుర్తింపు ఇంజిన్ (పత్రాలు) ఆధారంగా మేము వీడియో స్ట్రీమ్లో పెద్ద, వ్యూహాత్మకంగా ముఖ్యమైన వస్తువులను ఎలా గుర్తించాలో మీకు తెలియజేస్తాము.
సమస్య యొక్క ప్రకటన
ఇప్పటికే ఉన్న డెవలప్మెంట్లను ఉపయోగించి, ట్యాంక్ రికగ్నిషన్ సిస్టమ్ను రూపొందించండి, ఇది ఒక వస్తువును వర్గీకరించడాన్ని సాధ్యం చేస్తుంది, అలాగే ప్రత్యేక పరికరాలను ఉపయోగించకుండా పేలవంగా నియంత్రించబడిన పరిస్థితులలో ప్రాథమిక రేఖాగణిత సూచికలను (ధోరణి మరియు దూరం) నిర్ణయించండి.
నిర్ణయం
సమస్యను పరిష్కరించడానికి మేము స్టాటిస్టికల్ మెషీన్ లెర్నింగ్ విధానాన్ని ప్రధాన అల్గారిథమ్గా ఎంచుకున్నాము. కానీ మెషిన్ లెర్నింగ్ యొక్క ముఖ్య సమస్యలలో ఒకటి తగినంత మొత్తంలో శిక్షణ డేటాను కలిగి ఉండటం. సహజంగానే, మనకు అవసరమైన వస్తువులతో కూడిన వాస్తవ దృశ్యాల నుండి పొందిన సహజ చిత్రాలు మనకు అందుబాటులో ఉండవు. అందువల్ల, అదృష్టవశాత్తూ, శిక్షణ కోసం అవసరమైన డేటాను రూపొందించడాన్ని ఆశ్రయించాలని నిర్ణయించారు
లక్ష్య వస్తువులు 4 యుద్ధ ట్యాంకుల నమూనాలు: T-90 (రష్యా), M1A2 అబ్రమ్స్ (USA), T-14 (రష్యా), మెర్కవా III (ఇజ్రాయెల్). వస్తువులు బహుభుజి యొక్క వివిధ స్థానాల్లో ఉన్నాయి, తద్వారా వస్తువు యొక్క ఆమోదయోగ్యమైన కనిపించే కోణాల జాబితాను విస్తరిస్తుంది. ఇంజనీరింగ్ అడ్డంకులు, చెట్లు, పొదలు మరియు ఇతర ప్రకృతి దృశ్యం అంశాలు ముఖ్యమైన పాత్ర పోషించాయి.
ఈ విధంగా, రెండు రోజులలో మేము శిక్షణ మరియు అల్గోరిథం యొక్క నాణ్యత యొక్క తదుపరి మూల్యాంకనం కోసం తగినంత సెట్ను సేకరించాము (అనేక పదివేల చిత్రాలు).
వారు గుర్తింపును రెండు భాగాలుగా విభజించాలని నిర్ణయించుకున్నారు: వస్తువు స్థానికీకరణ మరియు ఆబ్జెక్ట్ వర్గీకరణ. శిక్షణ పొందిన వియోలా మరియు జోన్స్ వర్గీకరణను ఉపయోగించి స్థానికీకరణ నిర్వహించబడింది (అన్నింటికంటే, ట్యాంక్ ఒక సాధారణ దృఢమైన వస్తువు, ముఖం కంటే అధ్వాన్నంగా ఉండదు, కాబట్టి వియోలా మరియు జోన్స్ యొక్క “వివరంగా-బ్లైండ్” పద్ధతి లక్ష్య వస్తువును త్వరగా స్థానికీకరిస్తుంది). కానీ మేము కోణం యొక్క వర్గీకరణ మరియు నిర్ణయాన్ని కన్వల్యూషనల్ న్యూరల్ నెట్వర్క్కు అప్పగించాము - ఈ పనిలో డిటెక్టర్ మెర్కావా నుండి T-90ని వేరు చేసే లక్షణాలను విజయవంతంగా గుర్తించడం మాకు ముఖ్యం. ఫలితంగా, అదే రకమైన వస్తువుల స్థానికీకరణ మరియు వర్గీకరణ సమస్యను విజయవంతంగా పరిష్కరించే అల్గోరిథంల యొక్క సమర్థవంతమైన కూర్పును నిర్మించడం సాధ్యమైంది.
తర్వాత, మేము ఇప్పటికే ఉన్న మా అన్ని ప్లాట్ఫారమ్లలో (Intel, ARM, Elbrus, Baikal, KOMDIV) ఫలిత ప్రోగ్రామ్ను ప్రారంభించాము, పనితీరును పెంచడానికి గణనపరంగా కష్టతరమైన అల్గారిథమ్లను ఆప్టిమైజ్ చేసాము (దీని గురించి మేము ఇప్పటికే మా కథనాలలో చాలాసార్లు వ్రాసాము, ఉదాహరణకు ఇక్కడ
వివరించిన అన్ని చర్యల ఫలితంగా, మేము ముఖ్యమైన వ్యూహాత్మక మరియు సాంకేతిక లక్షణాలతో పూర్తి స్థాయి సాఫ్ట్వేర్ ఉత్పత్తిని పొందాము.
స్మార్ట్ ట్యాంక్ రీడర్
కాబట్టి, మేము మా కొత్త అభివృద్ధిని మీకు అందిస్తున్నాము - వీడియో స్ట్రీమ్లో ట్యాంకుల చిత్రాలను గుర్తించే ప్రోగ్రామ్ స్మార్ట్ ట్యాంక్ రీడర్, ఇది:
- ఇచ్చిన వస్తువుల సెట్ కోసం "స్నేహితుడు లేదా శత్రువు" సమస్యను నిజ సమయంలో పరిష్కరిస్తుంది;
- రేఖాగణిత పారామితులను నిర్ణయిస్తుంది (వస్తువుకు దూరం, వస్తువు యొక్క ప్రాధాన్యత ధోరణి);
- అనియంత్రిత వాతావరణ పరిస్థితులలో, అలాగే విదేశీ వస్తువుల ద్వారా వస్తువును పాక్షికంగా నిరోధించే సందర్భంలో పనిచేస్తుంది;
- రేడియో కమ్యూనికేషన్ లేకపోవడంతో సహా లక్ష్య పరికరంలో పూర్తిగా స్వయంప్రతిపత్త ఆపరేషన్;
- మద్దతు ఉన్న ప్రాసెసర్ ఆర్కిటెక్చర్ల జాబితా: ఎల్బ్రస్, బైకాల్, కోమ్డివివ్, అలాగే x86, x86_64, ARM;
- మద్దతు ఉన్న ఆపరేటింగ్ సిస్టమ్ల జాబితా: Elbrus OS, AstraLinux OS, Atlix OS, అలాగే MS Windows, macOS, gcc 4.8, Android, iOSకి మద్దతు ఇచ్చే వివిధ Linux పంపిణీలు;
- పూర్తిగా దేశీయ అభివృద్ధి.
సాధారణంగా, హాబ్రేపై మా కథనాల ముగింపులో, మేము మార్కెట్ప్లేస్కి లింక్ను అందిస్తాము, ఇక్కడ ఎవరైనా తమ మొబైల్ ఫోన్ని ఉపయోగిస్తున్నప్పుడు సాంకేతికత పనితీరును వాస్తవంగా అంచనా వేయడానికి అప్లికేషన్ యొక్క డెమో వెర్షన్ను డౌన్లోడ్ చేసుకోవచ్చు. ఈసారి, ఫలిత అప్లికేషన్ యొక్క ప్రత్యేకతలను పరిగణనలోకి తీసుకుంటే, ట్యాంక్ ఒక నిర్దిష్ట వైపుకు చెందినదా అని త్వరగా నిర్ణయించే సమస్యను మా పాఠకులందరూ వారి జీవితంలో ఎప్పుడూ ఎదుర్కోకూడదని మేము కోరుకుంటున్నాము.
మూలం: www.habr.com