Dalam menjalankan aktiviti kami, kami setiap hari menghadapi masalah menentukan keutamaan pembangunan. Memandangkan dinamik tinggi pembangunan industri IT, permintaan yang sentiasa meningkat daripada perniagaan dan kerajaan untuk teknologi baharu, setiap kali kami menentukan vektor pembangunan dan melaburkan kuasa dan dana kami sendiri dalam potensi saintifik syarikat kami, kami memastikan bahawa semua penyelidikan dan projek kami adalah asas dan sifat antara disiplin.
Oleh itu, dengan membangunkan teknologi utama kami - rangka kerja pengecaman data HIEROGLYPH, kami mengambil berat tentang kedua-dua meningkatkan kualiti pengecaman dokumen (barisan perniagaan utama kami) dan kemungkinan menggunakan teknologi untuk menyelesaikan masalah pengecaman yang berkaitan. Dalam artikel hari ini kami akan memberitahu anda bagaimana, berdasarkan enjin pengecaman kami (dokumen), kami membuat pengiktirafan objek yang lebih besar dan penting secara strategik dalam aliran video.
Pernyataan masalah
Menggunakan pembangunan sedia ada, bina sistem pengecaman tangki yang memungkinkan untuk mengklasifikasikan objek, serta menentukan penunjuk geometri asas (orientasi dan jarak) dalam keadaan yang tidak dikawal tanpa menggunakan peralatan khusus.
keputusan
Kami memilih pendekatan pembelajaran mesin statistik sebagai algoritma utama untuk menyelesaikan masalah. Tetapi salah satu masalah utama pembelajaran mesin ialah keperluan untuk mempunyai jumlah data latihan yang mencukupi. Jelas sekali, imej semula jadi yang diperoleh daripada pemandangan sebenar yang mengandungi objek yang kami perlukan tidak tersedia untuk kami. Oleh itu, ia telah memutuskan untuk menggunakan penjanaan data yang diperlukan untuk latihan, mujurlah
Objek sasaran ialah 4 model kereta kebal tempur: T-90 (Rusia), M1A2 Abrams (AS), T-14 (Rusia), Merkava III (Israel). Objek terletak pada kedudukan poligon yang berbeza, dengan itu mengembangkan senarai sudut boleh dilihat objek yang boleh diterima. Halangan kejuruteraan, pokok, semak dan elemen landskap lain memainkan peranan penting.
Oleh itu, dalam beberapa hari kami mengumpul set yang mencukupi untuk latihan dan penilaian seterusnya terhadap kualiti algoritma (beberapa puluh ribu imej).
Mereka memutuskan untuk membahagikan pengiktirafan itu sendiri kepada dua bahagian: penyetempatan objek dan klasifikasi objek. Penyetempatan dilakukan menggunakan pengelas Viola dan Jones yang terlatih (lagipun, tangki adalah objek tegar biasa, tidak lebih buruk daripada muka, jadi kaedah "buta terperinci" Viola dan Jones menyetempatkan objek sasaran dengan cepat). Tetapi kami mempercayakan klasifikasi dan penentuan sudut kepada rangkaian saraf konvolusi - dalam tugas ini adalah penting bagi kami bahawa pengesan berjaya mengenal pasti ciri-ciri yang, katakan, membezakan T-90 daripada Merkava. Akibatnya, adalah mungkin untuk membina komposisi algoritma yang berkesan yang berjaya menyelesaikan masalah penyetempatan dan klasifikasi objek dari jenis yang sama.
Seterusnya, kami melancarkan program yang terhasil pada semua platform sedia ada kami (Intel, ARM, Elbrus, Baikal, KOMDIV), mengoptimumkan algoritma pengiraan yang sukar untuk meningkatkan prestasi (kami telah menulis tentang perkara ini beberapa kali dalam artikel kami, contohnya di sini
Hasil daripada semua tindakan yang diterangkan, kami telah memperoleh produk perisian lengkap dengan ciri taktikal dan teknikal yang ketara.
Pembaca Tangki Pintar
Jadi, kami membentangkan kepada anda perkembangan baharu kami - program untuk mengenali imej kereta kebal dalam aliran video Pembaca Tangki Pintar, yang:
- Menyelesaikan masalah "rakan atau lawan" untuk set objek tertentu dalam masa nyata;
- Menentukan parameter geometri (jarak ke objek, orientasi pilihan objek);
- Berfungsi dalam keadaan cuaca yang tidak terkawal, serta dalam kes penyekatan separa objek oleh objek asing;
- Operasi autonomi sepenuhnya pada peranti sasaran, termasuk jika tiada komunikasi radio;
- Senarai seni bina pemproses yang disokong: Elbrus, Baikal, KOMDIV, serta x86, x86_64, ARM;
- Senarai sistem pengendalian yang disokong: Elbrus OS, AstraLinux OS, Atlix OS, serta MS Windows, macOS, pelbagai pengedaran Linux yang menyokong gcc 4.8, Android, iOS;
- Pembangunan domestik sepenuhnya.
Biasanya, dalam kesimpulan artikel kami tentang HabrΓ©, kami menyediakan pautan ke pasaran, di mana sesiapa yang menggunakan telefon mudah alih mereka boleh memuat turun versi demo aplikasi untuk benar-benar menilai prestasi teknologi. Kali ini, dengan mengambil kira spesifikasi aplikasi yang dihasilkan, kami berharap semua pembaca kami tidak pernah menghadapi masalah menentukan dengan cepat sama ada tangki milik pihak tertentu.
Sumber: www.habr.com