Google I/O 2024 – rok temu na scenie I/O Google po raz pierwszy podzielił się planami dotyczącymi Gemini: pionierskiego modelu od samego początku zbudowanego z myślą o natywnej multimodalności i zdolności rozumowania w obszarze tekstu, obrazu, wideo, kodu i nie tylko.
Był to to milowy krok w kierunku przekształcania dowolnych danych wejściowych w dowolne dane wyjściowe – „I/O” nowej generacji.

Od tego czasu Google wprowadziło pierwsze modele Gemini, jak dotąd najbardziej wydajne rozwiązania, charakteryzujące się najwyższej klasy działaniem w każdym multimodalnym teście porównawczym. Dwa miesiące później przedstawiono Gemini 1.5 Pro, czyli wielki przełom w aspekcie długości kontekstu. Model ten może spójnie przetwarzać 1 milion tokenów w środowisku produkcyjnym, więcej niż jakikolwiek inny wielkoskalowy model podstawowy.
Chcemy, aby każdy mógł czerpać korzyści z tego, co potrafi Gemini, dlatego zależało nam na szybkim udostępnieniu tych osiągnięć. Obecnie ponad 1,5 miliona deweloperów korzysta z modeli Gemini w naszych narzędziach. Służą one do debugowania kodu, uzyskiwania nowych informacji i tworzenia aplikacji AI nowej generacji – mówi w swoim wystąpieniu Sundara Pichaia na I/O 2024.
Przełomowe możliwości Gemini Google wykorzystuje również w usługach.
Obejrzyj krótkie podsumowanie i poznaj nowości AI od Google. #GoogleIO 🎉👇 https://t.co/RLx4E75te7
— Google Polska (@GooglePolska) May 15, 2024
Pokażemy dziś przykłady dotyczące Wyszukiwarki, Zdjęć, Workspace, Androida i nie tylko.
Rozwój usług
Obecnie z Gemini korzystają wszystkie usługi Google, które łącznie mają 2 miliardy użytkowników.
Google wprowadziło również nowe rozwiązania, w tym na urządzeniach mobilnych, dzięki którym użytkownicy mogą wchodzić w interakcje z Gemini bezpośrednio przez aplikację dostępną na Androida i iOS. A także poprzez Gemini Advanced, plan zapewniający dostęp do naszych najbardziej wydajnych modeli. W ciągu zaledwie trzech miesięcy aplikację tę wypróbowało ponad milion osób, a liczba użytkowników nieustannie rośnie.
Rozszerzone streszczenia wygenerowane przez AI w wyszukiwarce
Jednej z najbardziej ekscytujących przemian związanych z Gemini doświadcza wyszukiwarka Google.
W ciągu ostatniego roku Google odpowiedziało na miliardy zapytań w ramach generatywnej AI w wyszukiwarce. Użytkownicy stosują to rozwiązanie do wyszukiwania na zupełnie nowe sposoby i zadają nowe rodzaje dłuższych i bardziej złożonych zapytań, a nawet wyszukują za pomocą zdjęć i otrzymują najlepsze odpowiedzi, jak sieć może zaoferować.
Google testowało te rozwiązania poza Labs i cieszy nie tylko wzrost wykorzystania wyszukiwarki, ale także rosnące zadowolenie użytkowników.
Wyszukiwarka to miejsce pełne innowacji. Dzięki Gemini możemy tworzyć znacznie bardziej zaawansowane i wszechstronne rozwiązania w obszarze wyszukiwania, również w ramach naszych usług.
Przedstawiamy funkcję Zapytaj Zdjęć
Przykładem takich usług są uruchomione przez nas 9 lat temu Zdjęcia Google. Od tego czasu usługa ta pomaga użytkownikom w organizowaniu swoich najważniejszych wspomnień. Każdego dnia przesyłanych jest do niej ponad 6 miliardów zdjęć i filmów.
Wiele osób korzysta ze Zdjęć do odszukiwania zdarzeń ze swojego życia. Dzięki Gemini staje się to o wiele łatwiejsze.
Powiedzmy, że płacicie za parking, ale nie możecie przypomnieć sobie numeru swojej tablicy rejestracyjnej. Wcześniej można było wyszukiwać słowa kluczowe w Zdjęciach, a następnie przewijać zdjęcia z wielu lat, szukając tablic rejestracyjnych. Teraz możecie po prostu zapytać o to Zdjęć. Aplikacja zna samochody, które często pojawiają się na zdjęciach, dedukuje, który z nich należy do Was i może podać ich numer rejestracyjny.

Gemini na Androida
Z Androida korzystają miliardy użytkowników na całym świecie, dlatego z ogromną radością wprowadzamy głębszą integrację z Gemini, umożliwiającą optymalne wykorzystanie tego systemu operacyjnego. Gemini, Wasz nowy asystent AI, pomoże Wam zawsze i wszędzie. Do Androida dodaliśmy również modele Gemini, w tym nasz najnowszy model w urządzeniu: Gemini Nano z multimodalnością, który przetwarza tekst, obrazy, dźwięk i mowę, odblokowując nowe możliwości, a jednocześnie zachowując prywatność informacji na urządzeniu.
Android to pierwszy system operacyjny na urządzenia mobilne, który ma wbudowany model podstawowy. Gemini Nano zapewnia szybkie i bezproblemowe funkcjonowanie oraz dba o całkowitą prywatność informacji użytkowników. Jeszcze w tym roku Gemini Nano zostanie udostępniony na Pixelu i będzie miał pełnię multimodalnych możliwości, co oznacza, że oprócz przetwarzania wpisywanego tekstu, Wasze telefony będą rozumieć więcej informacji w kontekście, takim jak widoki, dźwięki czy język mówiony.
Wszystkie wiadomości dotyczące Androida znajdziecie tutaj.
Czytaj więcej na: Konferencja Google I/O 2024: I/O nowej generacji
Obserwuj nas na Google News
Zobacz również: Google Pixel: smartfony Google „AI od Google – zawsze pod ręką” już w Polsce
Źródło: Informacja prasowa Google
- Gemini otwiera nowe możliwości: szybsze modele, dłuższy kontekst i przyszłość asystentów AI
- Nowe modele i narzędzia generatywne stworzone z myślą o twórcach
- Generatywna AI w wyszukiwarce: pozwólcie Google wyszukiwać za Was
- Róbcie więcej dzięki Gemini: wypróbujcie model 1.5 Pro oraz nowe inteligentne funkcje
- Poznajcie jeszcze lepiej AI od Google na Androidzie
- Zapytaj Zdjęć z Gemini: nowy sposób wyszukiwania Waszych zdjęć
- Konferencja Google I/O 2024: I/O nowej generacji
Źródło zdjęć: Google
Tagi: Google I/O 2024, Gemini, Zdjęcia Google, Gemini na Androida, Gemini Nano, Google Pixel


