ในการดำเนินกิจกรรมของเรา เราเผชิญกับปัญหาในการกำหนดลำดับความสำคัญของการพัฒนาทุกวัน เมื่อพิจารณาถึงพลวัตระดับสูงของการพัฒนาของอุตสาหกรรมไอที ความต้องการที่เพิ่มขึ้นอย่างต่อเนื่องจากภาคธุรกิจและรัฐบาลสำหรับเทคโนโลยีใหม่ๆ แต่ละครั้งที่เรากำหนดเวกเตอร์ของการพัฒนา และลงทุนกำลังและเงินทุนของเราเองในศักยภาพทางวิทยาศาสตร์ของบริษัทของเรา เราตรวจสอบให้แน่ใจว่า การวิจัยและโครงการทั้งหมดของเรามีลักษณะพื้นฐานและสหวิทยาการ
ดังนั้น ด้วยการพัฒนาเทคโนโลยีหลักของเรา - กรอบงานการรับรู้ข้อมูล HIEROGLYPH เราจึงกังวลเกี่ยวกับทั้งการปรับปรุงคุณภาพของการรับรู้เอกสาร (สายธุรกิจหลักของเรา) และความเป็นไปได้ของการใช้เทคโนโลยีเพื่อแก้ไขปัญหาการรับรู้ที่เกี่ยวข้อง ในบทความวันนี้ เราจะบอกคุณว่าตามกลไกการจดจำของเรา (เอกสาร) เราทำการจดจำวัตถุที่ใหญ่กว่าและมีความสำคัญเชิงกลยุทธ์ในสตรีมวิดีโอได้อย่างไร
คำแถลงปัญหา
ใช้การพัฒนาที่มีอยู่ สร้างระบบการจดจำรถถังที่ทำให้สามารถจำแนกวัตถุได้ รวมทั้งกำหนดตัวบ่งชี้ทางเรขาคณิตพื้นฐาน (ทิศทางและระยะทาง) ในสภาวะที่มีการควบคุมไม่ดีโดยไม่ต้องใช้อุปกรณ์พิเศษ
การตัดสิน
เราเลือกแนวทางการเรียนรู้ของเครื่องเชิงสถิติเป็นอัลกอริธึมหลักในการแก้ปัญหา แต่ปัญหาสำคัญประการหนึ่งของ Machine Learning คือความต้องการข้อมูลการฝึกอบรมที่เพียงพอ แน่นอนว่าเราไม่สามารถหาภาพที่เป็นธรรมชาติซึ่งได้จากฉากจริงซึ่งมีวัตถุที่เราต้องการได้ ดังนั้นจึงตัดสินใจหันไปสร้างข้อมูลที่จำเป็นสำหรับการฝึกอบรมโชคดี
วัตถุเป้าหมายคือรถถังต่อสู้ 4 รุ่น: T-90 (รัสเซีย), M1A2 Abrams (สหรัฐอเมริกา), T-14 (รัสเซีย), Merkava III (อิสราเอล) วัตถุต่างๆ อยู่ในตำแหน่งต่างๆ ของรูปหลายเหลี่ยม จึงเป็นการขยายรายการมุมที่มองเห็นได้ของวัตถุที่ยอมรับได้ อุปสรรคทางวิศวกรรม ต้นไม้ พุ่มไม้ และองค์ประกอบภูมิทัศน์อื่นๆ มีบทบาทสำคัญ
ดังนั้นภายในสองสามวันเราจึงรวบรวมชุดที่เพียงพอสำหรับการฝึกอบรมและการประเมินคุณภาพของอัลกอริทึมในภายหลัง (รูปภาพหลายหมื่นภาพ)
พวกเขาตัดสินใจแบ่งการรับรู้ออกเป็นสองส่วน: การแปลวัตถุและการจำแนกวัตถุ การแปลเป็นภาษาท้องถิ่นดำเนินการโดยใช้เครื่องแยกประเภท Viola และ Jones ที่ผ่านการฝึกอบรม (ท้ายที่สุดแล้ว รถถังเป็นวัตถุแข็งปกติ ไม่เลวร้ายไปกว่าใบหน้า ดังนั้นวิธี "ตาบอดรายละเอียด" ของ Viola และ Jones จะแปลวัตถุเป้าหมายอย่างรวดเร็ว) แต่เรามอบความไว้วางใจในการจำแนกประเภทและการกำหนดมุมให้กับโครงข่ายประสาทเทียมแบบบิด ในงานนี้ สิ่งสำคัญสำหรับเราคือตัวตรวจจับจะระบุคุณสมบัติเหล่านั้นที่แยกแยะ T-90 จาก Merkava ได้สำเร็จ เป็นผลให้สามารถสร้างองค์ประกอบที่มีประสิทธิภาพของอัลกอริธึมที่สามารถแก้ไขปัญหาการแปลและการจำแนกประเภทของวัตถุประเภทเดียวกันได้สำเร็จ
ต่อไป เราเปิดตัวโปรแกรมผลลัพธ์บนแพลตฟอร์มที่มีอยู่ทั้งหมดของเรา (Intel, ARM, Elbrus, Baikal, KOMDIV) ปรับอัลกอริทึมที่ยากในการคำนวณให้เหมาะสมเพื่อเพิ่มประสิทธิภาพ (เราได้เขียนเกี่ยวกับเรื่องนี้หลายครั้งในบทความของเรา เช่นที่นี่
จากการดำเนินการทั้งหมดที่อธิบายไว้ เราได้รับผลิตภัณฑ์ซอฟต์แวร์ที่ครบครันพร้อมคุณสมบัติทางยุทธวิธีและทางเทคนิคที่สำคัญ
เครื่องอ่านรถถังอัจฉริยะ
ดังนั้นเราจึงขอนำเสนอการพัฒนาใหม่ของเรา - โปรแกรมสำหรับจดจำภาพของรถถังในสตรีมวิดีโอ เครื่องอ่านรถถังอัจฉริยะ, ที่:
- แก้ปัญหา "เพื่อนหรือศัตรู" สำหรับชุดวัตถุที่ระบุแบบเรียลไทม์
- กำหนดพารามิเตอร์ทางเรขาคณิต (ระยะห่างจากวัตถุ การวางแนวของวัตถุที่ต้องการ)
- ทำงานในสภาพอากาศที่ไม่มีการควบคุมตลอดจนในกรณีที่วัตถุแปลกปลอมปิดกั้นบางส่วนของวัตถุ
- การทำงานอัตโนมัติเต็มรูปแบบบนอุปกรณ์เป้าหมาย รวมถึงในกรณีที่ไม่มีการสื่อสารทางวิทยุ
- รายชื่อสถาปัตยกรรมโปรเซสเซอร์ที่รองรับ: Elbrus, Baikal, KOMDIV รวมถึง x86, x86_64, ARM;
- รายชื่อระบบปฏิบัติการที่รองรับ: Elbrus OS, AstraLinux OS, Atlix OS รวมถึง MS Windows, macOS, Linux ต่างๆ ที่รองรับ gcc 4.8, Android, iOS;
- การพัฒนาภายในประเทศอย่างสมบูรณ์
โดยปกติแล้ว ในบทสรุปของบทความของเราเกี่ยวกับ Habré เราจะให้ลิงก์ไปยังตลาดซื้อขาย ซึ่งใครก็ตามที่ใช้โทรศัพท์มือถือของตนสามารถดาวน์โหลดแอปพลิเคชันเวอร์ชันสาธิตเพื่อประเมินประสิทธิภาพของเทคโนโลยีได้จริง ในครั้งนี้ เมื่อพิจารณาถึงลักษณะเฉพาะของการใช้งานแล้ว เราหวังว่าผู้อ่านของเราทุกคนจะไม่ประสบปัญหาในการตัดสินอย่างรวดเร็วว่ารถถังเป็นของฝ่ายใดฝ่ายหนึ่งหรือไม่
ที่มา: will.com