Gemini 2.0 Flash – dostępny już dziś: nowy model agenta AI od Google

Google prezentuje Gemini 2.0, nasz jak dotąd najbardziej zaawansowany model AI z nowymi osiągnięciami w zakresie multimodalności – takimi jak natywne generowanie obrazów i dźwięku. Model może także natywnie wywoływać narzędzia takie jak wyszukiwarka Google, wykonywać kod oraz uruchamiać zewnętrzne funkcje określone przez użytkownika.
Gemini 2.0 Flash – dostępny już dziś
Google już dzisiaj wprowadza pierwszy model z serii Gemini 2.0: wersję eksperymentalną Gemini 2.0 Flash. Jest to wszechstronny model wyróżniający się niskimi opóźnieniami i lepszą wydajnością.
  • Model eksperymentalny Gemini 2.0 Flash jest teraz dostępny dla deweloperów w ramach interfejsu Gemini API w Google AI Studio oraz Vertex AI.
  • Od dzisiaj użytkownicy Gemini na całym świecie mogą też korzystać ze wspomnianego modelu, wybierając go w menu w aplikacji internetowej na komputerze lub telefonie. Wkrótce będzie on również dostępny w aplikacji mobilnej Gemini. Dzięki nowemu modelowi asystent Gemini będzie jeszcze bardziej pomocny i przydatny.

Więcej informacji: Blog Google Polska: Gemini 2.0: nowy model agenta AI

Wiadomość od Sundara Pichaia, prezesa Google i Alphabet:

Dostęp do informacji jest podstawą postępu ludzkości. Właśnie dlatego od ponad 26 lat naszą misją jest porządkowanie ich globalnego zasobu oraz uczynienie ich przystępnymi i przydatnymi. W tym celu nieustannie przesuwamy granice sztucznej inteligencji.

Taka była nasza wizja, gdy w grudniu ubiegłego roku wprowadziliśmy model Gemini 1.0. Po raz pierwszy opracowaliśmy jego natywnie multimodalne wersje, 1.0 i 1.5, znacznie usprawniając obsługę multimodalności i długich kontekstów. Przekłada się to na lepsze interpretowanie i możliwość przetwarzania znacznie większej ilości informacji zawartych w tekstach, materiałach wideo, na obrazach oraz w dźwięku i kodzie.

Teraz Gemini jest narzędziem używanym przez miliony deweloperów. Pomaga nam rozwijać wszystkie 7 naszych rodzin produktów, z których korzystają 2 miliardy użytkowników, i tworzyć nowe. Ceniona przez wiele osób usługa NotebookLM jest doskonałym przykładem możliwości, jakie dają funkcje multimodalne i długi kontekst.

W zeszłym roku inwestowaliśmy w rozwój bardziej agentowych modeli, dzięki czemu potrafią one lepiej rozumieć otaczający nas świat, myśleć wiele kroków naprzód i podejmować działania w naszym imieniu, pod naszym nadzorem.

Dziś z radością wkraczamy w kolejną erę modeli opracowanych z myślą o nowej epoce agentowej: przedstawiamy Gemini 2.0, nasz najbardziej zaawansowany model. Dzięki nowym osiągnięciom w zakresie multimodalności, takim jak natywne generowanie obrazu i dźwięku czy korzystanie z narzędzi natywnych, będziemy mogli tworzyć nowe agenty sztucznej inteligencji, pomagające w realizacji naszej wizji stworzenia uniwersalnego asystenta.

Właśnie oddajemy wersję 2.0 w ręce deweloperów i zaufanych testerów. Szybko pracujemy nad wprowadzeniem jej do naszych produktów, na czele z Gemini i wyszukiwarką. Od dziś nasz eksperymentalny model Gemini 2.0 Flash będzie dostępny dla wszystkich użytkowników Gemini. Wprowadzamy również nową funkcję o nazwie Deep Research, która wykorzystuje funkcje zaawansowanego rozumowania i długiego kontekstu, aby działać jako asystent badający złożone tematy i kompilujący raporty w imieniu użytkownika. Jest on już dostępny w Gemini Advanced.

Wpływ sztucznej inteligencji widać najbardziej w wyszukiwarce. Nasze przeglądy od AI docierają obecnie do miliarda ludzi, umożliwiając im zadawanie zupełnie nowych rodzajów pytań, a co za tym idzie – szybko stają się jedną z najpopularniejszych funkcji wyszukiwarki w historii. Kolejnym krokiem będzie wprowadzenie do przeglądów od AI zaawansowanych funkcji rozumowania modelu Gemini 2.0, aby jeszcze lepiej przetwarzać złożone zagadnienia i wieloetapowe pytania, a także kod, zaawansowane równania matematyczne i zapytania multimodalne. W tym tygodniu rozpoczęliśmy ograniczone testy, a na początku przyszłego roku rozszerzymy ich skalę. W nadchodzących 12 miesiącach będziemy także wprowadzać przeglądy od AI w kolejnych krajach i językach.

Usprawnienia modelu 2.0 są wynikiem dziesięcioletnich inwestycji w nasze zróżnicowane, kompleksowe podejście do innowacji w zakresie AI. Model ten jest oparty na specjalnie dostosowanym sprzęcie, takim jak nasze procesory TPU szóstej generacji – Trillium. Były one wykorzystywane w całym procesie wnioskowania i trenowania modelu Gemini 2.0, a dziś są ogólnie dostępne dla klientów, aby mogli wykorzystać ich niezwykłe możliwości.

Podczas gdy model Gemini 1.0 służył do porządkowania i interpretowania informacji, Gemini 2.0 ma sprawić, że będą one znacznie bardziej przydatne. Z niecierpliwością wyczekuję kolejnych etapów rozwoju sztucznej inteligencji.

Obserwuj nas na Google News

ZOBACZ RÓWNIEŻ:

Źródło: Informacja prasowa: Google
Autor zdjęć: Google

Kontakt

Zapraszamy do kontaktu: redakcja(at)technosenior.pl

Odkryj więcej z TECHNOSenior

Zasubskrybuj już teraz, aby czytać dalej i uzyskać dostęp do pełnego archiwum.

Czytaj dalej