JetBrains เปิดตัว Mellum2 โมเดล MoE สำหรับสถานการณ์ AI ที่รวดเร็วในระหว่างการพัฒนา









JetBrains ได้เปิดตัวโมเดลใหม่แล้ว เมลลัม2ออกแบบมาเพื่อใช้ในเครื่องมือ AI สำหรับการพัฒนาซอฟต์แวร์ โมเดลนี้เผยแพร่ภายใต้ใบอนุญาต Apache 2.0สามารถดูค่าพารามิเตอร์ต่างๆ ได้ที่ Hugging Face JetBrains เน้นย้ำว่า Mellum2 ได้รับการฝึกฝนตั้งแต่เริ่มต้น และไม่ได้ออกแบบมาเพื่อการทำงานกับข้อความและโค้ดโดยเฉพาะ เช่น การกำหนดเส้นทางการร้องขอ, RAG pipelines, การสรุปข้อมูล, เอเจนต์เสริม และการใช้งานแบบส่วนตัวในโครงสร้างพื้นฐานของบริษัท

Mellum2 สร้างขึ้นบนสถาปัตยกรรม ส่วนผสมของผู้เชี่ยวชาญโดยมีขนาดรวมทั้งหมด 12 พันล้านพารามิเตอร์ โทเค็นแต่ละอันจะถูกเปิดใช้งานได้เพียงประมาณ 1,000 ครั้งเท่านั้น 2.5 พันล้านพารามิเตอร์ซึ่งจะช่วยลดต้นทุนการคำนวณและเวลาแฝงระหว่างการอนุมาน ตามข้อมูลของ JetBrains ประสิทธิภาพการทดสอบของโมเดลนี้เทียบได้กับโมเดลโอเพนซอร์สที่มีขนาดใกล้เคียงกัน แต่ให้ความเร็วในการอนุมานมากกว่าสองเท่า

JetBrains อธิบายว่า Mellum2 เป็นวิวัฒนาการของโมเดล Mellum ดั้งเดิม ซึ่งสร้างขึ้นครั้งแรกเพื่อใช้ในการเติมโค้ดอัตโนมัติ เวอร์ชันใหม่นี้ขยายขอบเขตไปสู่การทำงานที่หลากหลายมากขึ้น ซึ่งต้องอาศัยทั้งโค้ดโปรแกรมและภาษาธรรมชาติ บริษัทวางตำแหน่ง Mellum2 เป็นโมเดลที่ "เน้นเฉพาะด้าน" ไม่ใช่สิ่งที่จะมาทดแทน LLM ขนาดใหญ่ที่ใช้งานได้ทั่วไป แต่เป็นส่วนประกอบที่รวดเร็วและเชี่ยวชาญสำหรับการดำเนินการระดับกลางที่เกิดขึ้นบ่อยครั้งภายในระบบ AI ที่ซับซ้อน

ตัวอย่างการใช้งานที่เสนอ ได้แก่ เรียกว่า การจำแนกและการกำหนดเส้นทางการร้องขอระหว่างโมเดลและเครื่องมือ การบีบอัดและการประมวลผลบริบทในระบบ RAG การเตรียมข้อมูลสำหรับเอเจนต์ การกำหนดตารางเวลา การตรวจสอบความถูกต้องของผลลัพธ์ระดับกลาง และการดำเนินการในพื้นที่ในสภาพแวดล้อมที่ไม่สามารถส่งซอร์สโค้ดหรือข้อมูลภายในไปยัง API ภายนอกได้

บนใบหน้าที่กำลังกอด เผยแพร่แล้ว คอลเลกชัน เมลลัม 2ซึ่งประกอบด้วยโมเดลหลายเวอร์ชัน ได้แก่ Thinking, Instruct, Thinking-SFT, Instruct-SFT, Base และ Base-Pretrain โดยโมเดลเหล่านี้เผยแพร่ในรูปแบบ Safetensors ภายใต้ใบอนุญาต Apache 2.0
มีตัวอย่างการใช้งานผ่าน Transformers, vLLM, SGLang และ Docker Model Runner เพื่อใช้ในการเริ่มต้นใช้งาน

สิ่งที่น่าสนใจในเชิงเทคนิคมากกว่านั้นไม่ใช่การเกิดขึ้นของโมเดลโอเพนซอร์สอีกแบบหนึ่ง แต่เป็นช่องทางเฉพาะที่ JetBrains เลือก บริษัทไม่ได้มุ่งเน้นที่จะแข่งขันกับโมเดลอเนกประสงค์ขนาดใหญ่ แต่เน้นไปที่ส่วนประกอบราคาประหยัดและรวดเร็วที่สามารถบูรณาการเข้ากับ IDE, ผู้ช่วยภายใน, ระบบ RAG ขององค์กร และไปป์ไลน์เอเจนต์ได้โดยตรง สำหรับนักพัฒนาและบริษัทต่างๆ นั่นหมายถึงความสามารถในการเรียกใช้ตรรกะ AI บางส่วนในเครื่องหรือบนเซิร์ฟเวอร์ของตนเอง ในขณะที่ยังคงควบคุมโค้ด ข้อมูล และต้นทุนการอนุมานได้

ที่มา: linux.org.ru

ซื้อโฮสติ้งที่เชื่อถือได้สำหรับไซต์ที่มีการป้องกัน DDoS เซิร์ฟเวอร์ VPS VDS 🔥 ซื้อบริการเว็บโฮสติ้งที่เชื่อถือได้ พร้อมระบบป้องกัน DDoS และเซิร์ฟเวอร์ VPS/VDS | ProHoster