JetBrains hat ein Modell eröffnet Mellum2Das Modell wurde für den Einsatz in KI-Werkzeugen zur Softwareentwicklung entwickelt und wird unter einer Lizenz veröffentlicht. Apache 2.0Die Gewichtungen sind auf Hugging Face verfügbar. JetBrains betont, dass Mellum2 von Grund auf neu trainiert wurde und nicht für multimodale Aufgaben, sondern für die Arbeit mit Text und Code konzipiert ist: Anfrageweiterleitung, RAG-Pipelines, Zusammenfassung, Hilfsagenten und private Bereitstellung in der Unternehmensinfrastruktur.
Mellum2 basiert auf der Architektur Mischung aus ExpertenMit einer Gesamtgröße von 12 Milliarden Parameter Pro Token werden nur etwa 1000 aktiviert. 2.5 Milliarden ParameterDies soll die Rechenkosten und Latenzzeiten während der Inferenz reduzieren. Laut JetBrains ist die Benchmark-Performance des Modells mit Open-Source-Modellen ähnlicher Größe vergleichbar, bietet aber eine mehr als doppelt so hohe Inferenzgeschwindigkeit.
JetBrains beschreibt Mellum2 als Weiterentwicklung des ursprünglichen Mellum-Modells, das ursprünglich für die Codevervollständigung entwickelt wurde. Die neue Version deckt ein breiteres Aufgabenspektrum ab, das sowohl die Verarbeitung von Programmcode als auch von natürlicher Sprache erfordert. Das Unternehmen positioniert Mellum2 als ein „fokussiertes“ Modell – nicht als Ersatz für große, universelle Sprachverarbeitungsmodelle, sondern als schnelle, spezialisierte Komponente für häufige Zwischenoperationen in komplexen KI-Systemen.
Zu den vorgeschlagenen Anwendungsfällen gehören: werden angerufen Klassifizierung und Weiterleitung von Anfragen zwischen Modellen und Werkzeugen, Komprimierung und Verarbeitung von Kontext in RAG-Systemen, Aufbereitung von Daten für Agenten, Terminplanung, Validierung von Zwischenergebnissen und lokale Ausführung in Umgebungen, in denen es nicht möglich ist, Quellcode oder interne Daten an externe APIs zu senden.
Beim Umarmen des Gesichts herausgegeben von коллекция Mellum 2Das Paket umfasst mehrere Modellvarianten: Thinking, Instruct, Thinking-SFT, Instruct-SFT, Base und Base-Pretrain. Die Modelle werden im Safetensors-Format unter der Apache-2.0-Lizenz vertrieben.
Beispiele für die Verwendung mit Transformers, vLLM, SGLang und Docker Model Runner werden für den Start bereitgestellt.
Technisch interessanter ist nicht das Aufkommen eines weiteren Open-Source-Modells, sondern die von JetBrains gewählte Nische. Das Unternehmen konzentriert sich nicht auf den Wettbewerb mit den größten Allzweckmodellen, sondern auf kostengünstige und schnelle Komponenten, die sich direkt in IDEs, interne Assistenten, unternehmensweite RAG-Systeme und Agentenpipelines integrieren lassen. Für Entwickler und Unternehmen bedeutet dies die Möglichkeit, KI-Logik lokal oder auf eigenen Servern auszuführen und gleichzeitig die Kontrolle über Code, Daten und Inferenzkosten zu behalten.
Source: linux.org.ru




