Տանկերի ճանաչում վիդեո հոսքում՝ օգտագործելով մեքենայական ուսուցման մեթոդներ (+2 տեսանյութ Էլբրուսի և Բայկալի հարթակներում)

Տանկերի ճանաչում վիդեո հոսքում՝ օգտագործելով մեքենայական ուսուցման մեթոդներ (+2 տեսանյութ Էլբրուսի և Բայկալի հարթակներում)

Մեր գործունեության ընթացքում մենք ամեն օր բախվում ենք զարգացման առաջնահերթությունների որոշման խնդրին։ Հաշվի առնելով ՏՏ ոլորտի զարգացման բարձր դինամիկան, բիզնեսի և կառավարության կողմից նոր տեխնոլոգիաների անընդհատ աճող պահանջարկը, ամեն անգամ, երբ մենք որոշում ենք զարգացման վեկտորը և ներդնում սեփական ուժերն ու միջոցները մեր ընկերության գիտական ​​ներուժի մեջ, համոզվում ենք, որ. մեր բոլոր հետազոտություններն ու նախագծերը հիմնարար և միջդիսցիպլինար բնույթ են կրում:

Հետևաբար, զարգացնելով մեր հիմնական տեխնոլոգիան՝ HIEROGLYPH տվյալների ճանաչման շրջանակը, մենք մտահոգված ենք ինչպես փաստաթղթերի ճանաչման որակի բարելավմամբ (մեր հիմնական բիզնես գիծ), այնպես էլ տեխնոլոգիայի օգտագործման հնարավորությամբ՝ կապված ճանաչման խնդիրները լուծելու համար: Այսօրվա հոդվածում մենք ձեզ կպատմենք, թե ինչպես, հիմնվելով մեր ճանաչման շարժիչի (փաստաթղթերի) վրա, մենք տեսահոսքով ճանաչեցինք ավելի մեծ, ռազմավարական նշանակություն ունեցող օբյեկտները:

Խնդրի ձևակերպում

Օգտագործելով գոյություն ունեցող զարգացումները, կառուցեք տանկի ճանաչման համակարգ, որը հնարավորություն է տալիս դասակարգել օբյեկտը, ինչպես նաև որոշել հիմնական երկրաչափական ցուցիչները (կողմնորոշումը և հեռավորությունը) վատ վերահսկվող պայմաններում՝ առանց մասնագիտացված սարքավորումների օգտագործման:

որոշում

Որպես խնդրի լուծման հիմնական ալգորիթմ ընտրեցինք վիճակագրական մեքենայական ուսուցման մոտեցումը։ Բայց մեքենայական ուսուցման հիմնական խնդիրներից մեկը վերապատրաստման բավարար քանակությամբ տվյալների անհրաժեշտությունն է: Ակնհայտ է, որ իրական տեսարաններից ստացված բնական պատկերները, որոնք պարունակում են մեզ անհրաժեշտ առարկաներ, մեզ հասանելի չեն: Ուստի, բարեբախտաբար, որոշվեց դիմել մարզումների համար անհրաժեշտ տվյալների ստեղծմանը Մենք այս վայրում մեծ փորձ ունենք. Եվ այնուամենայնիվ, մեզ անբնական թվաց այս առաջադրանքի համար տվյալների ամբողջական սինթեզումը, ուստի հատուկ դասավորություն պատրաստվեց իրական տեսարանների նմանակման համար: Մոդելը պարունակում է տարբեր առարկաներ, որոնք նմանակում են գյուղը՝ բնորոշ լանդշաֆտային ծածկույթ, թփեր, ծառեր, ցանկապատեր և այլն: Նկարներն արվել են փոքր ֆորմատի թվային ֆոտոխցիկի միջոցով: Պատկերի նկարահանման գործընթացում տեսարանի ֆոնը զգալիորեն փոխվել է, որպեսզի ալգորիթմներն ավելի ամուր դարձնեն ֆոնային փոփոխություններին:

Տանկերի ճանաչում վիդեո հոսքում՝ օգտագործելով մեքենայական ուսուցման մեթոդներ (+2 տեսանյութ Էլբրուսի և Բայկալի հարթակներում)

Թիրախային օբյեկտները եղել են մարտական ​​տանկերի 4 մոդել՝ T-90 (Ռուսաստան), M1A2 Abrams (ԱՄՆ), T-14 (Ռուսաստան), Merkava III (Իսրայել): Օբյեկտները գտնվում էին բազմանկյան տարբեր դիրքերում՝ դրանով իսկ ընդլայնելով օբյեկտի ընդունելի տեսանելի անկյունների ցանկը։ Էական դեր են խաղացել ինժեներական պատնեշները, ծառերը, թփերը և լանդշաֆտային այլ տարրեր։

Տանկերի ճանաչում վիդեո հոսքում՝ օգտագործելով մեքենայական ուսուցման մեթոդներ (+2 տեսանյութ Էլբրուսի և Բայկալի հարթակներում)

Այսպիսով, մի քանի օրվա ընթացքում մենք հավաքեցինք բավարար հավաքածու՝ վերապատրաստման և ալգորիթմի որակի հետագա գնահատման համար (մի քանի տասնյակ հազար պատկեր):

Նրանք որոշեցին ինքնին ճանաչումը բաժանել երկու մասի՝ օբյեկտների տեղայնացում և օբյեկտների դասակարգում: Տեղայնացումը կատարվել է վարժեցված Վիոլայի և Ջոնսի դասակարգիչի միջոցով (ի վերջո, տանկը սովորական կոշտ առարկա է, ոչ ավելի վատ, քան դեմքը, ուստի Վիոլայի և Ջոնսի «դետալից կույր» մեթոդը արագ տեղայնացնում է թիրախային օբյեկտը): Բայց մենք անկյան դասակարգումն ու որոշումը վստահեցինք կոնվոլյուցիոն նեյրոնային ցանցին. այս առաջադրանքում մեզ համար կարևոր է, որ դետեկտորը հաջողությամբ բացահայտի այն հատկանիշները, որոնք, ասենք, տարբերում են T-90-ը Մերկավայից: Արդյունքում հնարավոր եղավ կառուցել ալգորիթմների արդյունավետ կոմպոզիցիա, որը հաջողությամբ լուծում է նույն տեսակի օբյեկտների տեղայնացման և դասակարգման խնդիրը։

Տանկերի ճանաչում վիդեո հոսքում՝ օգտագործելով մեքենայական ուսուցման մեթոդներ (+2 տեսանյութ Էլբրուսի և Բայկալի հարթակներում)

Այնուհետև մենք գործարկեցինք ստացված ծրագիրը մեր բոլոր գոյություն ունեցող հարթակներում (Intel, ARM, Elbrus, Baikal, KOMDIV), օպտիմիզացրեցինք հաշվողականորեն դժվար ալգորիթմները՝ արդյունավետությունը բարձրացնելու համար (մենք արդեն մի քանի անգամ գրել ենք այս մասին մեր հոդվածներում, օրինակ՝ այստեղ։ https://habr.com/ru/company/smartengines/blog/438948/ կամ https://habr.com/ru/company/smartengines/blog/351134/) և իրական ժամանակում հասել է ծրագրի կայուն աշխատանքին սարքի վրա:


Նկարագրված բոլոր գործողությունների արդյունքում մենք ձեռք ենք բերել զգալի մարտավարական և տեխնիկական բնութագրերով լիարժեք ծրագրային արտադրանք:

Smart Tank Reader

Այսպիսով, մենք ձեզ ենք ներկայացնում մեր նոր մշակումը` տանկերի պատկերները տեսահոսքի միջոցով ճանաչելու ծրագիր: Smart Tank Reader, որը:

Տանկերի ճանաչում վիդեո հոսքում՝ օգտագործելով մեքենայական ուսուցման մեթոդներ (+2 տեսանյութ Էլբրուսի և Բայկալի հարթակներում)

  • Իրական ժամանակում լուծում է «ընկեր կամ թշնամի» խնդիրը տվյալ օբյեկտների համար.
  • Որոշում է երկրաչափական պարամետրերը (օբյեկտի հեռավորությունը, օբյեկտի նախընտրելի կողմնորոշումը);
  • Աշխատում է անվերահսկելի եղանակային պայմաններում, ինչպես նաև օտար առարկաների կողմից օբյեկտի մասնակի արգելափակման դեպքում.
  • Լիովին ինքնավար գործողություն թիրախային սարքի վրա, ներառյալ ռադիոհաղորդակցության բացակայության դեպքում.
  • Աջակցվող պրոցեսորների ճարտարապետությունների ցանկ՝ Elbrus, Baikal, KOMDIV, ինչպես նաև x86, x86_64, ARM;
  • Աջակցվող օպերացիոն համակարգերի ցանկ՝ Elbrus OS, AstraLinux OS, Atlix OS, ինչպես նաև MS Windows, macOS, Linux-ի տարբեր բաշխումներ, որոնք աջակցում են gcc 4.8, Android, iOS;
  • Ամբողջովին ներքին զարգացում.

Սովորաբար, Habré-ի վերաբերյալ մեր հոդվածների վերջաբանում մենք տրամադրում ենք հղում դեպի շուկա, որտեղ ցանկացած ոք, ով օգտագործում է իր բջջային հեռախոսը, կարող է ներբեռնել հավելվածի ցուցադրական տարբերակը՝ իրականում գնահատելու տեխնոլոգիայի կատարումը: Այս անգամ, հաշվի առնելով ստացված հավելվածի առանձնահատկությունները, մեր բոլոր ընթերցողներին մաղթում ենք, որ կյանքում երբեք չհանդիպեն տանկը որոշակի կողմին պատկանելու մասին արագ որոշելու խնդրին:

Source: www.habr.com

Добавить комментарий