การรับรู้รถถังในวิดีโอสตรีมโดยใช้วิธีการเรียนรู้ของเครื่อง (วิดีโอ +2 รายการบนแพลตฟอร์ม Elbrus และ Baikal)

การรับรู้รถถังในวิดีโอสตรีมโดยใช้วิธีการเรียนรู้ของเครื่อง (วิดีโอ +2 รายการบนแพลตฟอร์ม Elbrus และ Baikal)

ในการดำเนินกิจกรรมของเรา เราเผชิญกับปัญหาในการกำหนดลำดับความสำคัญของการพัฒนาทุกวัน เมื่อพิจารณาถึงพลวัตระดับสูงของการพัฒนาของอุตสาหกรรมไอที ความต้องการที่เพิ่มขึ้นอย่างต่อเนื่องจากภาคธุรกิจและรัฐบาลสำหรับเทคโนโลยีใหม่ๆ แต่ละครั้งที่เรากำหนดเวกเตอร์ของการพัฒนา และลงทุนกำลังและเงินทุนของเราเองในศักยภาพทางวิทยาศาสตร์ของบริษัทของเรา เราตรวจสอบให้แน่ใจว่า การวิจัยและโครงการทั้งหมดของเรามีลักษณะพื้นฐานและสหวิทยาการ

ดังนั้น ด้วยการพัฒนาเทคโนโลยีหลักของเรา - กรอบงานการรับรู้ข้อมูล HIEROGLYPH เราจึงกังวลเกี่ยวกับทั้งการปรับปรุงคุณภาพของการรับรู้เอกสาร (สายธุรกิจหลักของเรา) และความเป็นไปได้ของการใช้เทคโนโลยีเพื่อแก้ไขปัญหาการรับรู้ที่เกี่ยวข้อง ในบทความวันนี้ เราจะบอกคุณว่าตามกลไกการจดจำของเรา (เอกสาร) เราทำการจดจำวัตถุที่ใหญ่กว่าและมีความสำคัญเชิงกลยุทธ์ในสตรีมวิดีโอได้อย่างไร

คำแถลงปัญหา

ใช้การพัฒนาที่มีอยู่ สร้างระบบการจดจำรถถังที่ทำให้สามารถจำแนกวัตถุได้ รวมทั้งกำหนดตัวบ่งชี้ทางเรขาคณิตพื้นฐาน (ทิศทางและระยะทาง) ในสภาวะที่มีการควบคุมไม่ดีโดยไม่ต้องใช้อุปกรณ์พิเศษ

การตัดสิน

เราเลือกแนวทางการเรียนรู้ของเครื่องเชิงสถิติเป็นอัลกอริธึมหลักในการแก้ปัญหา แต่ปัญหาสำคัญประการหนึ่งของ Machine Learning คือความต้องการข้อมูลการฝึกอบรมที่เพียงพอ แน่นอนว่าเราไม่สามารถหาภาพที่เป็นธรรมชาติซึ่งได้จากฉากจริงซึ่งมีวัตถุที่เราต้องการได้ ดังนั้นจึงตัดสินใจหันไปสร้างข้อมูลที่จำเป็นสำหรับการฝึกอบรมโชคดี เรามีประสบการณ์มากมายในที่นี้. แต่ถึงกระนั้น การสังเคราะห์ข้อมูลสำหรับงานนี้อย่างสมบูรณ์ก็ดูไม่เป็นธรรมชาติสำหรับเรา ดังนั้นจึงมีการเตรียมเค้าโครงพิเศษเพื่อจำลองฉากจริง แบบจำลองประกอบด้วยวัตถุต่างๆ ที่จำลองชนบท: ภูมิทัศน์ที่มีลักษณะเฉพาะ พุ่มไม้ ต้นไม้ รั้ว ฯลฯ ภาพถูกถ่ายโดยใช้กล้องดิจิตอลขนาดเล็ก ในระหว่างกระบวนการจับภาพ พื้นหลังของฉากเปลี่ยนไปอย่างมากเพื่อทำให้อัลกอริธึมมีประสิทธิภาพมากขึ้นต่อการเปลี่ยนแปลงพื้นหลัง

การรับรู้รถถังในวิดีโอสตรีมโดยใช้วิธีการเรียนรู้ของเครื่อง (วิดีโอ +2 รายการบนแพลตฟอร์ม Elbrus และ Baikal)

วัตถุเป้าหมายคือรถถังต่อสู้ 4 รุ่น: T-90 (รัสเซีย), M1A2 Abrams (สหรัฐอเมริกา), T-14 (รัสเซีย), Merkava III (อิสราเอล) วัตถุต่างๆ อยู่ในตำแหน่งต่างๆ ของรูปหลายเหลี่ยม จึงเป็นการขยายรายการมุมที่มองเห็นได้ของวัตถุที่ยอมรับได้ อุปสรรคทางวิศวกรรม ต้นไม้ พุ่มไม้ และองค์ประกอบภูมิทัศน์อื่นๆ มีบทบาทสำคัญ

การรับรู้รถถังในวิดีโอสตรีมโดยใช้วิธีการเรียนรู้ของเครื่อง (วิดีโอ +2 รายการบนแพลตฟอร์ม Elbrus และ Baikal)

ดังนั้นภายในสองสามวันเราจึงรวบรวมชุดที่เพียงพอสำหรับการฝึกอบรมและการประเมินคุณภาพของอัลกอริทึมในภายหลัง (รูปภาพหลายหมื่นภาพ)

พวกเขาตัดสินใจแบ่งการรับรู้ออกเป็นสองส่วน: การแปลวัตถุและการจำแนกวัตถุ การแปลเป็นภาษาท้องถิ่นดำเนินการโดยใช้เครื่องแยกประเภท Viola และ Jones ที่ผ่านการฝึกอบรม (ท้ายที่สุดแล้ว รถถังเป็นวัตถุแข็งปกติ ไม่เลวร้ายไปกว่าใบหน้า ดังนั้นวิธี "ตาบอดรายละเอียด" ของ Viola และ Jones จะแปลวัตถุเป้าหมายอย่างรวดเร็ว) แต่เรามอบความไว้วางใจในการจำแนกประเภทและการกำหนดมุมให้กับโครงข่ายประสาทเทียมแบบบิด ในงานนี้ สิ่งสำคัญสำหรับเราคือตัวตรวจจับจะระบุคุณสมบัติเหล่านั้นที่แยกแยะ T-90 จาก Merkava ได้สำเร็จ เป็นผลให้สามารถสร้างองค์ประกอบที่มีประสิทธิภาพของอัลกอริธึมที่สามารถแก้ไขปัญหาการแปลและการจำแนกประเภทของวัตถุประเภทเดียวกันได้สำเร็จ

การรับรู้รถถังในวิดีโอสตรีมโดยใช้วิธีการเรียนรู้ของเครื่อง (วิดีโอ +2 รายการบนแพลตฟอร์ม Elbrus และ Baikal)

ต่อไป เราเปิดตัวโปรแกรมผลลัพธ์บนแพลตฟอร์มที่มีอยู่ทั้งหมดของเรา (Intel, ARM, Elbrus, Baikal, KOMDIV) ปรับอัลกอริทึมที่ยากในการคำนวณให้เหมาะสมเพื่อเพิ่มประสิทธิภาพ (เราได้เขียนเกี่ยวกับเรื่องนี้หลายครั้งในบทความของเรา เช่นที่นี่ https://habr.com/ru/company/smartengines/blog/438948/ หรือ https://habr.com/ru/company/smartengines/blog/351134/) และบรรลุการทำงานที่เสถียรของโปรแกรมบนอุปกรณ์แบบเรียลไทม์


จากการดำเนินการทั้งหมดที่อธิบายไว้ เราได้รับผลิตภัณฑ์ซอฟต์แวร์ที่ครบครันพร้อมคุณสมบัติทางยุทธวิธีและทางเทคนิคที่สำคัญ

เครื่องอ่านรถถังอัจฉริยะ

ดังนั้นเราจึงขอนำเสนอการพัฒนาใหม่ของเรา - โปรแกรมสำหรับจดจำภาพของรถถังในสตรีมวิดีโอ เครื่องอ่านรถถังอัจฉริยะ, ที่:

การรับรู้รถถังในวิดีโอสตรีมโดยใช้วิธีการเรียนรู้ของเครื่อง (วิดีโอ +2 รายการบนแพลตฟอร์ม Elbrus และ Baikal)

  • แก้ปัญหา "เพื่อนหรือศัตรู" สำหรับชุดวัตถุที่ระบุแบบเรียลไทม์
  • กำหนดพารามิเตอร์ทางเรขาคณิต (ระยะห่างจากวัตถุ การวางแนวของวัตถุที่ต้องการ)
  • ทำงานในสภาพอากาศที่ไม่มีการควบคุมตลอดจนในกรณีที่วัตถุแปลกปลอมปิดกั้นบางส่วนของวัตถุ
  • การทำงานอัตโนมัติเต็มรูปแบบบนอุปกรณ์เป้าหมาย รวมถึงในกรณีที่ไม่มีการสื่อสารทางวิทยุ
  • รายชื่อสถาปัตยกรรมโปรเซสเซอร์ที่รองรับ: Elbrus, Baikal, KOMDIV รวมถึง x86, x86_64, ARM;
  • รายชื่อระบบปฏิบัติการที่รองรับ: Elbrus OS, AstraLinux OS, Atlix OS รวมถึง MS Windows, macOS, Linux ต่างๆ ที่รองรับ gcc 4.8, Android, iOS;
  • การพัฒนาภายในประเทศอย่างสมบูรณ์

โดยปกติแล้ว ในบทสรุปของบทความของเราเกี่ยวกับ Habré เราจะให้ลิงก์ไปยังตลาดซื้อขาย ซึ่งใครก็ตามที่ใช้โทรศัพท์มือถือของตนสามารถดาวน์โหลดแอปพลิเคชันเวอร์ชันสาธิตเพื่อประเมินประสิทธิภาพของเทคโนโลยีได้จริง ในครั้งนี้ เมื่อพิจารณาถึงลักษณะเฉพาะของการใช้งานแล้ว เราหวังว่าผู้อ่านของเราทุกคนจะไม่ประสบปัญหาในการตัดสินอย่างรวดเร็วว่ารถถังเป็นของฝ่ายใดฝ่ายหนึ่งหรือไม่

ที่มา: will.com

เพิ่มความคิดเห็น