Meta udostępnia nowy model AI – V-JEPA 2 

Meta ogłasza kolejny ważny krok w rozwoju sztucznej inteligencji i udostępnia V-JEPA 2 (Video Joint Embedding Predictive Architecture 2). To innowacyjny „world model”, czyli system AI, który uczy się na temat otaczającej rzeczywistości na podstawie obserwacji, podobnie jak robią to ludzie.

V-Jepa 2 (Video Joint Embedding Predictive Architecture 2)
Ten zaawansowany model opiera się na architekturze JEPA, zaprezentowanej przez Meta w 2022 roku. Jego wyjątkowość polega na tym, że uczy się głównie z materiałów wideo i to bez potrzeby ręcznego etykietowania danych (tzw. self-supervised learning).
V-JEPA 2 potrafi rozwijać intuicję fizyczną, przewidując, jakie będą konsekwencje różnych działań w świecie fizycznym, oraz planować własne zachowania. Model ten, działając jak wewnętrzny symulator, osiąga imponujące wyniki w rozumieniu obrazu i przewidywaniu zdarzeń w świecie fizycznym, co przybliża do stworzenia AI zdolnej do samodzielnego rozumowania i działania w realnym środowisku.
Kluczowe możliwości V-JEPA 2
  • Model uczy się „intuicji fizycznej”, czyli potrafi przewidzieć, co się stanie, gdy np. upuścimy przedmiot, lub jak zachowają się obiekty w ruchu.
  • V-JEPA 2 pozwala robotom na planowanie i interakcję z przedmiotami, których nigdy wcześniej nie widziały, w zupełnie nowych miejscach. To otwiera drogę do bardziej samodzielnych robotów, które nie potrzebują szczegółowych instrukcji do każdego zadania.
  • Model przetworzył ponad milion godzin wideo i milion obrazów. Dzięki temu zdobył ogromną wiedzę o tym, jak ludzie i przedmioty wchodzą ze sobą w interakcje w realnym świecie.
  • Meta udostępnia kod V-JEPA 2 oraz narzędzia do jego wykorzystania (tzw. punkty kontrolne modelu) dla firm i naukowców. Celem jest globalne przyspieszenie badań i rozwoju AI, co ostatecznie ma prowadzić do tworzenia lepszych i bardziej użytecznych systemów.
Wraz z V-JEPA 2, Meta udostępnia również trzy nowe benchmarki, które pozwolą społeczności badawczej ocenić i udoskonalić modele AI w zakresie rozumienia świata na podstawie wideo. To kluczowy krok, aby przybliżyć AI do ludzkiej zdolności rozumienia fizyki.
Wydanie V-JEPA 2 oraz towarzyszących mu narzędzi to ważny etap w budowaniu systemów AI, które potrafią uczyć się o świecie w sposób zbliżony do ludzi, planować wykonywanie nieznanych zadań i efektywnie adaptować się do zmieniającego się otoczenia.

Kontakt

Zapraszamy do kontaktu: redakcja(at)technosenior.pl

Odkryj więcej z TECHNOSenior

Zasubskrybuj już teraz, aby czytać dalej i uzyskać dostęp do pełnego archiwum.

Czytaj dalej