Llama 2 – nowa generacja modelu językowego typu open source Meta i Microsoft

 

Mark Zuckerberg oraz Satya Nadella, Dyrektor Generalny Microsoft, ogłosili powstanie Llama 2 – nowej generacji modelu językowego typu open source, który Meta bezpłatnie udostępniła dziś do badań i użytku komercyjnego.

Na stronie internetowej uwzględniono wagi poszczególnych modeli i kod początkowy dla wstępnie wytrenowanych i dopracowanych wersji (parametry 7B, 13B i 70B). Dostęp do modeli Llama 2 można również uzyskać za pośrednictwem Microsoft Azure i Windows, Amazon Web Services i Hugging Face. Szeroka dostępność modeli to krok w stronę budowania modeli sztucznej inteligencji na miarę dzisiejszych czasów. Jest to szczególnie ważne w przypadku modeli takich jak Llama 2, które są rozwijane w przestrzeni generatywnej, gdzie technologia rozwija się wyjątkowo szybko dzięki prawdziwym, jakościowym przełomom.

Llama 2
Llama 2

Więcej informacji na ten temat można znaleźć w poście w Newsroomie.

Poniżej treść postu Marka Zuckerberga, który opublikował na swoim Facebooku.

Post Marka Zuckerberga:

Współpracujemy z firmą Microsoft, aby wprowadzić Llama 2 – następną generację naszego modelu języka open source. Llama 2 będzie dostępna bezpłatnie do celów badawczych i komercyjnych.

Recenzja Travel Pack Green Cell, czyli must have każdego nie(tylko) globtrotera

Meta ma długą historię open sourcingu naszej infrastruktury i sztucznej inteligencji — od PyTorch, wiodącej platformy uczenia maszynowego, przez modele takie jak Segment Anything, ImageBind i Dino, po podstawową infrastrukturę w ramach projektu Open Compute. Takie działanie pomogło nam tworzyć lepsze produkty i napędzać rozwój całej branży.

Otwarte oprogramowanie napędza innowacje, ponieważ udostępnia nowe technologie znacznie większej liczbie programistów. Poprawia również bezpieczeństwo – gdy oprogramowanie jest ogólnodostępne, więcej osób może je przeanalizować, aby zidentyfikować i naprawić potencjalne problemy. Uważam, że gdyby ekosystem był bardziej otwarty, pozwoliłoby to na szybszy postęp. Z tego względu udostępniamy Llama 2 na zasadzie open source.

Test Honor Magic5 Pro – powrót do Polski z przytupem

Dzisiaj oddajemy do użytku wstępnie wytrenowane i dopracowane modele z parametrami 7B, 13B i 70B. Llama 2 została przeszkolona na 40% więcej danych niż Llama 1 i ma dodatkowe ulepszenia w swojej budowie. W przypadku precyzyjnie dopracowanych modeli zebraliśmy ponad 1 milion adnotacji i zastosowaliśmy nadzorowane dostrajanie i uczenie wzmacniające z wykorzystaniem informacji zwrotnych od ludzi (RLHF), uzyskując świetne wyniki w zakresie bezpieczeństwa i jakości.

Modele można pobrać bezpośrednio lub – w ramach naszego partnerstwa z firmą Microsoft – uzyskać do nich dostęp za pośrednictwem platformy Azure. Istnieje również zoptymalizowana wersja, którą można uruchomić lokalnie w systemie Windows.

Kontakt

Zapraszamy do kontaktu: redakcja(at)technosenior.pl