Europejski model AI Mellum2 bez opłat

Mellum2 – model, zaprojektowany dla profesjonalnych środowisk AI, od dziś dostępny będzie publicznie jako open source.

Mellum2

JetBrains, globalny dostawca narzędzi programistycznych, udostępnił jako open source model Mellum2 – wysoko wydajną, efektywną kosztowo alternatywę dla systemów AI działających w środowiskach produkcyjnych. Model został opublikowany na licencji Apache 2.0 i jest dostępny na platformie Hugging Face.

Od uzupełniania kodu do wszechstronnego narzędzia AI

Mellum to model językowy rozwijany przez JetBrains z myślą o potrzebach inżynierii oprogramowania. Jego pierwsza generacja skupiała się na uzupełnianiu kodu. Mellum2 stanowi istotny krok naprzód – silnik obsługuje zarówno język naturalny, jak i kod, stając się wszechstronnym komponentem nowoczesnych systemów AI: do routingu zapytań, streszczania, pośredniego wnioskowania i budowy złożonych przepływów agentów.

Architektura Mixture-of-Experts – wydajność bez kompromisów

Mellum2 oparty jest na architekturze Mixture-of-Experts (MoE). Model dysponuje 12 mld parametrów, z których tylko 2,5 mld jest aktywnych dla każdego tokenu. Takie podejście pozwala znacząco obniżyć koszty obliczeniowe przy zachowaniu wysokiej przepustowości i niskich opóźnień – co jest kluczowe w środowiskach produkcyjnych działających w czasie rzeczywistym. W porównaniu z modelami podobnej klasy, Mellum2 skraca czas wnioskowania o ponad połowę, zachowując przy tym konkurencyjną jakość generowanego kodu, wyniki w zadaniach matematycznych i rozumowaniu.

Model nie jest multimodalny – celowo. Specjalizacja w języku naturalnym i kodzie sprawia, że Mellum2 działa szybciej i efektywniej w typowych zadaniach inżynierii oprogramowania niż modele ogólnego przeznaczenia.

Praktyczne zastosowania

Mellum2 jest przeznaczony do konkretnych zastosowań w systemach AI:

  • routing i orkiestracja zadań – analiza przychodzących zapytań i kierowanie ich do właściwego modelu lub narzędzia,
  • potoki RAG o niskich opóźnieniach – szybkie pobieranie kontekstu, streszczanie
    i generowanie odpowiedzi,
  • szybkie sub-agenty w złożonych przepływach pracy agentów,
  • prywatne, lokalne wdrożenia – Mellum2 można uruchamiać lokalnie lub we własnej infrastrukturze, zachowując pełną kontrolę nad kodem i danymi.

Filozofia „focal model” – przyszłość należy do skoordynowanych systemów

Według JetBrains przyszłość systemów AI nie należy do pojedynczych, wielkich modeli, lecz do skoordynowanych ekosystemów wyspecjalizowanych komponentów. Modele frontier będą nadal przesuwać granice możliwości, ale praktyczne produkty AI wymagają też tzw. focal models – szybkich, wyspecjalizowanych elementów obsługujących wysokoczęstotliwościowe zadania w sposób efektywny i kontrolowany. Mellum2 pełni właśnie tę rolę w nowej generacji narzędzi AI dla programistów.

Szczegółowy raport techniczny dotyczący architektury i wyników benchmarków jest dostępny na platformie arXiv: https://arxiv.org/abs/2605.31268.

Dostępność

Mellum2 jest dostępny na Hugging Face w kolekcji JetBrains/Mellum-2. Model można eksperymentalnie uruchamiać, dostrajać (fine-tuning) oraz wdrażać we własnej infrastrukturze.

Obserwuj nas na Google News

Zobacz również:

Źródło: Informacja prasowa: JetBrains
Źródło zdjęć: JetBrains

Kontakt

Zapraszamy do kontaktu: redakcja(at)technosenior.pl

Odkryj więcej z TECHNOSenior

Zasubskrybuj już teraz, aby czytać dalej i uzyskać dostęp do pełnego archiwum.

Czytaj dalej