โครงข่ายประสาทเทียมใหม่ของ Google มีความแม่นยำและรวดเร็วกว่าอะนาล็อกยอดนิยมอย่างมาก

โครงข่ายประสาทเทียมแบบหมุนวน (CNN) ซึ่งได้รับแรงบันดาลใจจากกระบวนการทางชีววิทยาในเปลือกสมองการมองเห็นของมนุษย์ เหมาะสำหรับงานต่างๆ เช่น การจดจำวัตถุและใบหน้า แต่การปรับปรุงความแม่นยำนั้นจำเป็นต้องอาศัยความน่าเบื่อและการปรับแต่งอย่างละเอียด นั่นเป็นสาเหตุที่นักวิทยาศาสตร์จาก Google AI Research กำลังสำรวจโมเดลใหม่ๆ ที่ปรับขนาด CNN ด้วยวิธีที่ "มีโครงสร้างมากขึ้น" พวกเขาเผยแพร่ผลงานของพวกเขาใน статье “EfficientNet: ทบทวนโมเดลการปรับขนาดสำหรับโครงข่ายประสาทเทียมแบบ Convolutional” โพสต์บนพอร์ทัลทางวิทยาศาสตร์ Arxiv.org รวมถึงใน สิ่งพิมพ์ ในบล็อกของคุณ ผู้เขียนร่วมอ้างว่าตระกูลระบบปัญญาประดิษฐ์ที่เรียกว่า EfficientNets มีความแม่นยำเกินมาตรฐานของ CNN และเพิ่มประสิทธิภาพของโครงข่ายประสาทเทียมได้มากถึง 10 เท่า

โครงข่ายประสาทเทียมใหม่ของ Google มีความแม่นยำและรวดเร็วกว่าอะนาล็อกยอดนิยมอย่างมาก

“แนวทางปฏิบัติทั่วไปของแบบจำลองการปรับขนาดคือการเพิ่มความลึกหรือความกว้างของ CNN โดยพลการ และใช้ความละเอียดสูงกว่าของภาพที่ป้อนเข้าสำหรับการฝึกอบรมและการประเมินผล” Mingxing Tan วิศวกรซอฟต์แวร์พนักงานเขียนและ Quoc V .Le หัวหน้านักวิทยาศาสตร์ของ Google AI) “ไม่เหมือนกับวิธีการแบบดั้งเดิมที่ปรับขนาดพารามิเตอร์เครือข่ายตามอำเภอใจ เช่น ความกว้าง ความลึก และความละเอียดอินพุต วิธีการของเราจะปรับขนาดแต่ละมิติอย่างสม่ำเสมอด้วยชุดปัจจัยการปรับขนาดคงที่”

เพื่อปรับปรุงประสิทธิภาพให้ดียิ่งขึ้น นักวิจัยสนับสนุนการใช้เครือข่ายแกนหลักใหม่ mobile inverted bottleneck convolution (MBConv) ซึ่งทำหน้าที่เป็นพื้นฐานสำหรับโมเดลตระกูล EfficientNets

ในการทดสอบ EfficientNets ได้แสดงให้เห็นถึงทั้งความแม่นยำที่สูงขึ้นและมีประสิทธิภาพที่ดีกว่า CNN ที่มีอยู่ ซึ่งช่วยลดขนาดพารามิเตอร์และความต้องการทรัพยากรการคำนวณตามลำดับความสำคัญ หนึ่งในโมเดลคือ EfficientNet-B7 แสดงให้เห็นขนาดที่เล็กลง 8,4 เท่า และมีประสิทธิภาพดีกว่า CNN Gpipe อันโด่งดังถึง 6,1 เท่า และยังได้รับความแม่นยำ 84,4% และ 97,1% (Top-1 และ Top-5) ผลลัพธ์ 50 รายการ) ในการทดสอบ ชุด ImageNet เมื่อเปรียบเทียบกับ CNN ResNet-4 ยอดนิยม EfficientNet รุ่นอื่นคือ EfficientNet-B82,6 ซึ่งใช้ทรัพยากรที่คล้ายคลึงกัน ได้รับความแม่นยำ 76,3% เทียบกับ 50% สำหรับ ResNet-XNUMX

โมเดล EfficientNets ทำงานได้ดีกับชุดข้อมูลอื่นๆ โดยมีความแม่นยำสูงบนเกณฑ์มาตรฐาน 100 จาก 91,7 รายการ รวมถึงชุดข้อมูล CIFAR-XNUMX (ความแม่นยำ XNUMX%) และ ดอกไม้ (98,8%)

โครงข่ายประสาทเทียมใหม่ของ Google มีความแม่นยำและรวดเร็วกว่าอะนาล็อกยอดนิยมอย่างมาก

“ด้วยการปรับปรุงประสิทธิภาพของแบบจำลองประสาทอย่างมีนัยสำคัญ เราคาดหวังว่า EfficientNets มีศักยภาพที่จะทำหน้าที่เป็นกรอบงานใหม่สำหรับงานการมองเห็นคอมพิวเตอร์ในอนาคต” Tan และ Li เขียน

ซอร์สโค้ดและสคริปต์การฝึกอบรมสำหรับหน่วยประมวลผล Tensor ระบบคลาวด์ (TPU) ของ Google มีให้ใช้งานได้ฟรี Github.



ที่มา: 3dnews.ru

เพิ่มความคิดเห็น