Meta ogłasza kolejny ważny krok w rozwoju sztucznej inteligencji i udostępnia V-JEPA 2 (Video Joint Embedding Predictive Architecture 2). To innowacyjny „world model”, czyli system AI, który uczy się na temat otaczającej rzeczywistości na podstawie obserwacji, podobnie jak robią to ludzie.

Ten zaawansowany model opiera się na architekturze JEPA, zaprezentowanej przez Meta w 2022 roku. Jego wyjątkowość polega na tym, że uczy się głównie z materiałów wideo i to bez potrzeby ręcznego etykietowania danych (tzw. self-supervised learning).
V-JEPA 2 potrafi rozwijać intuicję fizyczną, przewidując, jakie będą konsekwencje różnych działań w świecie fizycznym, oraz planować własne zachowania. Model ten, działając jak wewnętrzny symulator, osiąga imponujące wyniki w rozumieniu obrazu i przewidywaniu zdarzeń w świecie fizycznym, co przybliża do stworzenia AI zdolnej do samodzielnego rozumowania i działania w realnym środowisku.
Kluczowe możliwości V-JEPA 2
-
Model uczy się „intuicji fizycznej”, czyli potrafi przewidzieć, co się stanie, gdy np. upuścimy przedmiot, lub jak zachowają się obiekty w ruchu.
-
V-JEPA 2 pozwala robotom na planowanie i interakcję z przedmiotami, których nigdy wcześniej nie widziały, w zupełnie nowych miejscach. To otwiera drogę do bardziej samodzielnych robotów, które nie potrzebują szczegółowych instrukcji do każdego zadania.
-
Model przetworzył ponad milion godzin wideo i milion obrazów. Dzięki temu zdobył ogromną wiedzę o tym, jak ludzie i przedmioty wchodzą ze sobą w interakcje w realnym świecie.
-
Meta udostępnia kod V-JEPA 2 oraz narzędzia do jego wykorzystania (tzw. punkty kontrolne modelu) dla firm i naukowców. Celem jest globalne przyspieszenie badań i rozwoju AI, co ostatecznie ma prowadzić do tworzenia lepszych i bardziej użytecznych systemów.
Wraz z V-JEPA 2, Meta udostępnia również trzy nowe benchmarki, które pozwolą społeczności badawczej ocenić i udoskonalić modele AI w zakresie rozumienia świata na podstawie wideo. To kluczowy krok, aby przybliżyć AI do ludzkiej zdolności rozumienia fizyki.
Wydanie V-JEPA 2 oraz towarzyszących mu narzędzi to ważny etap w budowaniu systemów AI, które potrafią uczyć się o świecie w sposób zbliżony do ludzi, planować wykonywanie nieznanych zadań i efektywnie adaptować się do zmieniającego się otoczenia.
Więcej szczegółów na temat V-JEPA 2 oraz dostęp do kodu i benchmarków znajduje się w najnowszym wpisie na blogu Meta.
Obserwuj nas na Google News
Zobacz również:
- 🎥A3 PRO – kosmiczny uchwyt samochodowy z TEMU, który trzyma lepiej niż pasażer na zakręcie!
- Meta AI: nowy sposób uzyskiwania dostępu do asystenta AI
- Recenzja Netatmo Advance: Prywatność i Bezpieczeństwo w Jednym – Inteligentna Kamera, która Cię Rozumie
- 🛡️ Tapo C230 – Kamera, która widzi wszystko. Czy za 160 zł możesz naprawdę zabezpieczyć dom?
- 🔩 Pancerny i inteligentny? KOSPET TANK M3 ULTRA – smartwatch z klasą wojskową i AMOLED-em za rozsądną cenę – opinia i test
- 📦Kino domowe w dłoni? Testuję Epson EF-21G – stylowy projektor laserowy z Google TV i ekranem do 150 cali
Źródło: Informacja prasowa: Meta
Źródło zdjęć: ChatGPT Image


