Mellum2 – model, zaprojektowany dla profesjonalnych środowisk AI, od dziś dostępny będzie publicznie jako open source.

JetBrains, globalny dostawca narzędzi programistycznych, udostępnił jako open source model Mellum2 – wysoko wydajną, efektywną kosztowo alternatywę dla systemów AI działających w środowiskach produkcyjnych. Model został opublikowany na licencji Apache 2.0 i jest dostępny na platformie Hugging Face.
Od uzupełniania kodu do wszechstronnego narzędzia AI
Mellum to model językowy rozwijany przez JetBrains z myślą o potrzebach inżynierii oprogramowania. Jego pierwsza generacja skupiała się na uzupełnianiu kodu. Mellum2 stanowi istotny krok naprzód – silnik obsługuje zarówno język naturalny, jak i kod, stając się wszechstronnym komponentem nowoczesnych systemów AI: do routingu zapytań, streszczania, pośredniego wnioskowania i budowy złożonych przepływów agentów.
Architektura Mixture-of-Experts – wydajność bez kompromisów
Mellum2 oparty jest na architekturze Mixture-of-Experts (MoE). Model dysponuje 12 mld parametrów, z których tylko 2,5 mld jest aktywnych dla każdego tokenu. Takie podejście pozwala znacząco obniżyć koszty obliczeniowe przy zachowaniu wysokiej przepustowości i niskich opóźnień – co jest kluczowe w środowiskach produkcyjnych działających w czasie rzeczywistym. W porównaniu z modelami podobnej klasy, Mellum2 skraca czas wnioskowania o ponad połowę, zachowując przy tym konkurencyjną jakość generowanego kodu, wyniki w zadaniach matematycznych i rozumowaniu.
Model nie jest multimodalny – celowo. Specjalizacja w języku naturalnym i kodzie sprawia, że Mellum2 działa szybciej i efektywniej w typowych zadaniach inżynierii oprogramowania niż modele ogólnego przeznaczenia.
Praktyczne zastosowania
Mellum2 jest przeznaczony do konkretnych zastosowań w systemach AI:
- routing i orkiestracja zadań – analiza przychodzących zapytań i kierowanie ich do właściwego modelu lub narzędzia,
- potoki RAG o niskich opóźnieniach – szybkie pobieranie kontekstu, streszczanie
i generowanie odpowiedzi, - szybkie sub-agenty w złożonych przepływach pracy agentów,
- prywatne, lokalne wdrożenia – Mellum2 można uruchamiać lokalnie lub we własnej infrastrukturze, zachowując pełną kontrolę nad kodem i danymi.
Filozofia „focal model” – przyszłość należy do skoordynowanych systemów
Według JetBrains przyszłość systemów AI nie należy do pojedynczych, wielkich modeli, lecz do skoordynowanych ekosystemów wyspecjalizowanych komponentów. Modele frontier będą nadal przesuwać granice możliwości, ale praktyczne produkty AI wymagają też tzw. focal models – szybkich, wyspecjalizowanych elementów obsługujących wysokoczęstotliwościowe zadania w sposób efektywny i kontrolowany. Mellum2 pełni właśnie tę rolę w nowej generacji narzędzi AI dla programistów.
Szczegółowy raport techniczny dotyczący architektury i wyników benchmarków jest dostępny na platformie arXiv: https://arxiv.org/abs/2605.31268.
Dostępność
Mellum2 jest dostępny na Hugging Face w kolekcji JetBrains/Mellum-2. Model można eksperymentalnie uruchamiać, dostrajać (fine-tuning) oraz wdrażać we własnej infrastrukturze.
Obserwuj nas na Google News
Zobacz również:
- 15,6 CALA SZOKU! 🤯 Ten tablet zastępuje monitor, telewizor i laptop? | MESWAO B3 Pro
- Test ZTE G50 5G: Wywiozłem potwora z Wi-Fi 7 na działkę. Czy robot koszący dostał turbodoładowania?
- GPS bez telefonu i bateria do 20 dni – test realme Watch S5 trafia w punkt
- Test soundcore Boom 2 Plus: Czy 140 W basu potrafi przepędzić komary i rozkręcić grilla u teściów?
- Największa wyszukiwarka na świecie zmyśla
- Google Search Live: Koniec niebieskich linków
- Nie logujesz się do ChatGPT? OpenAI i tak wyświetli Ci reklamy


