To moment, na który czekałeś cały rok: Dzień Google I/O! Google co roku rozpoczyna konferencję dla programistów od lawiny ogłoszeń ujawniających najnowsze rzeczy. Briana Już ośmieszyliśmy się, dzieląc się tym, czego oczekujemy.
Wiemy, że nie zawsze masz czas, aby obejrzeć całą dzisiejszą dwugodzinną prezentację, więc nie spieszmy się, ponieważ ogłaszamy szybkie hity z najważniejszych nagłówków wiadomości. Przystępna i łatwa do usunięcia lista. Oto jest!
Piksel 8a
Google nie może się doczekać, aż we/wy zaprezentuje najnowszy dodatek do linii Pixel i ogłosił w zeszłym tygodniu nowego Pixela 8a. Telefon będzie dostępny w cenie od 499 dolarów i będzie dostępny we wtorek. Aktualizacje i czego się po nich spodziewamy. Na szczycie listy znajduje się układ Tensor G3. Czytaj więcej
Łupek pikseli
Tablet Google Pixel o nazwie Slate jest już dostępny. Jeśli pamiętasz, Brian recenzował tablet Pixel mniej więcej w zeszłym roku i mówił tylko o podstawach. Co ciekawe, tablet dostępny jest bez niego. Czytaj więcej
Poproś o zdjęcia
Zdjęcia Google otrzymają zastrzyk sztucznej inteligencji wraz z uruchomieniem eksperymentalnej funkcji o nazwie Zapytaj Zdjęcia obsługiwanej przez model AI Gemini firmy Google. Nowy dodatek, który zostanie wprowadzony jeszcze tego lata, umożliwi użytkownikom przeszukiwanie kolekcji Zdjęć Google przy użyciu zapytań w języku naturalnym, które wykorzystują sztuczną inteligencję do zrozumienia treści zdjęć i innych metadanych.
Dzięki przetwarzaniu języka naturalnego optymalizacja AI sprawi, że znajdowanie odpowiednich treści będzie bardziej intuicyjne i skróci proces ręcznego wyszukiwania, zanim użytkownicy będą szukać konkretnych osób, miejsc lub rzeczy na swoich zdjęciach.
A przykład był piękny. „Złote paski?” Kto nie kocha duetu tygrysów i golden retrieverów wypchanego tygrysem? Czytaj więcej
Wszystko o Bliźniakach
Bliźnięta 1.5 Pro: Kolejnym ulepszeniem generatywnej sztucznej inteligencji jest to, że Gemini może teraz analizować dłuższe dokumenty, bazy kodów, filmy i nagrania audio niż kiedykolwiek wcześniej.
Prywatna zapowiedź nowej wersji obecnego flagowego modelu firmy, Gemini 1.5 Pro, ujawniła, że może ona pomieścić aż 2 miliony tokenów. To ponad dwukrotnie więcej niż poprzednia maksymalna kwota. Na tym poziomie nowa wersja Gemini 1.5 Pro obsługuje największy wkład spośród wszystkich dostępnych na rynku modeli. Czytaj więcej
Bliźnięta na żywo: Firma udostępniła w Gemini nową usługę o nazwie Gemini Live, która umożliwia użytkownikom prowadzenie „głębszych” rozmów głosowych z Gemini na smartfonach. Użytkownicy mogą przerywać Gemini podczas mówienia chatbota, zadając pytania wyjaśniające, a on dostosowuje się w czasie rzeczywistym do ich wzorców mowy. Gemini może widzieć otoczenie użytkowników i reagować na nie za pomocą zdjęć lub filmów zarejestrowanych aparatami w smartfonach.
Na pierwszy rzut oka Live nie wydaje się drastycznym ulepszeniem istniejącej technologii. Google twierdzi jednak, że wykorzystuje nowe techniki z dziedziny generatywnej sztucznej inteligencji, aby zapewnić lepszą, mniej podatną na błędy analizę obrazu, i łączy te techniki z ulepszonym silnikiem mowy, aby zapewnić bardziej spójną, ekspresyjną emocjonalnie i realistyczną wieloobrotową rozmowę. Czytaj więcej
Bliźnięta Nano: Teraz małe ogłoszenie. Google buduje najmniejszy ze swoich modeli sztucznej inteligencji, Gemini Nano, bezpośrednio w kliencie stacjonarnym Chrome, zaczynając od Chrome 126. Jak twierdzi firma, umożliwi to programistom wykorzystanie modelu na urządzeniu do wdrożenia własnych funkcji sztucznej inteligencji. Na przykład Google planuje wykorzystać tę nową funkcję do ulepszenia funkcji, takich jak istniejące narzędzie „Pomóż mi pisać” z Workspace Lab w Gmailu. Czytaj więcej
Bliźnięta na Androidzie: Google Gemini na Androida, zastępujący sztuczną inteligencję Asystenta Google, wkrótce wykorzysta swoją zdolność do głębokiej integracji z mobilnym systemem operacyjnym Android i aplikacjami Google. Użytkownicy mogą przeciągać i upuszczać obrazy wygenerowane przez sztuczną inteligencję bezpośrednio do Gmaila, Wiadomości Google i innych aplikacji. Tymczasem Google twierdzi, że użytkownicy YouTube mogą kliknąć „Posłuchaj tego filmu”, aby znaleźć określone informacje na temat tego filmu na YouTube. Czytaj więcej
Bliźnięta w Mapach Google: Możliwości modelu Gemini zaczynają się od platformy Google Maps i interfejsu API Places dla programistów. Programiści mogą tworzyć podsumowania miejsc i regionów oparte na sztucznej inteligencji we własnych aplikacjach i witrynach internetowych. Podsumowania opierają się na przeprowadzonej przez Gemini analizie spostrzeżeń społeczności Map Google, liczącej ponad 300 milionów autorów. Co jest lepsze? Deweloperzy nie muszą już pisać niestandardowych opisów własnych lokalizacji. Czytaj więcej
Jednostki przetwarzające Tensor uzyskują zwiększoną wydajność
Google zaprezentowało kolejną generację – dokładnie szóstą – chipów AI Tensor Processing Units (TPU). Nazywane Trillium, zostaną wprowadzone na rynek jeszcze w tym roku. Jeśli pamiętacie, tradycją I/O jest ogłaszanie nowej generacji TPU, a chipy pojawią się dopiero w dalszej części roku.
Te nowe TPU będą miały 4,7-krotny wzrost wydajności obliczeniowej na chip w porównaniu z piątą generacją. Co ważniejsze, Trillium zawiera Sparscore trzeciej generacji, który Google opisuje jako „specjalistyczny akcelerator do przetwarzania bardzo dużych osadzonych elementów, powszechnych w zaawansowanych obciążeniach związanych z rankingami i rekomendacjami”. Czytaj więcej
AI w wyszukiwaniu
Rozwiawszy podejrzenia, że firma traci udział w rynku na rzecz konkurentów takich jak ChatGPT i Perplexity, Google dodaje więcej sztucznej inteligencji do swojego wyszukiwania. Udostępnia użytkownikom w USA przeglądy oparte na sztucznej inteligencji. Ponadto firma ma nadzieję wykorzystać Gemini jako agenta do takich celów, jak planowanie podróży. Czytaj więcej
Google planuje wykorzystać generatywną sztuczną inteligencję do uporządkowania całej strony wyników wyszukiwania dla określonych wyników. Stanowi to dodatek do istniejącej funkcji przeglądu AI, która tworzy krótki fragment zawierający zbiorcze informacje na temat, którego szukasz. Funkcja przeglądu AI jest zwykle dostępna we wtorek po pracy nad programem AI Labs firmy Google. Czytaj więcej
Kreatywne ulepszenia AI
Google ogłosiło Image 3, najnowszy z rodziny modeli AI od technologicznego giganta Image.
Demis Hassabis, szef DeepMind, działu Google zajmującego się badaniami nad sztuczną inteligencją, powiedział, że Image3 lepiej przekształca tekst w obrazy niż jego poprzednik, Image2, i jest najbardziej „kreatywną i wszechstronną” ze swoich generacji. Ponadto model generuje mniej „rozpraszających artefaktów” i błędów – dodał.
„Ten [also] „Nasz najlepszy model renderowania tekstu stanowi wyzwanie dla modeli renderowania obrazów” – dodał Hassabis. Czytaj więcej
Aktualizacje Gemmy 2
Gemma 2, następna generacja modeli Google Gemma, zostanie wypuszczona na rynek w czerwcu z modelem o 27 miliardach parametrów. Czytaj więcej
Projekt IDX
Project ITX, opracowane przez firmę środowisko programistyczne nowej generacji, oparte na sztucznej inteligencji i oparte na przeglądarce, jest obecnie w fazie otwartej wersji beta. Dzięki tej aktualizacji środowisko IDE integruje się z platformą Map Google, ułatwiając dodawanie funkcji geolokalizacji do aplikacji, a także integruje się z narzędziami Chrome Dev Tools i Lighthouse, aby ułatwić debugowanie aplikacji. Wkrótce Google umożliwi także wdrażanie aplikacji w Cloud Run, bezserwerowej platformie Google Cloud, w celu uruchamiania usług front-end i back-end. Czytaj więcej
Weo
Google oszukuje Sorę OpenAI za pomocą View, modelu AI, który może tworzyć klipy wideo w rozdzielczości 1080p. Veo może rejestrować różnorodne style wizualne i filmowe, w tym sceny krajobrazów i poklatkowe, a także wprowadzać edycje i zmiany w już utworzonych scenach.
Opiera się także na wstępnych komercyjnych pracach Google nad tworzeniem wideo, których premiera miała miejsce w kwietniu, podczas których wykorzystano rodzinę modeli do tworzenia zdjęć Image 2 do tworzenia zapętlonych klipów wideo. Czytaj więcej
Zakreśl, aby wyszukać
Oparta na sztucznej inteligencji funkcja Circle to Search, która pozwala użytkownikom Androida uzyskiwać natychmiastowe odpowiedzi za pomocą gestów takich jak kręcenie, może teraz rozwiązywać bardziej złożone problemy z zakresu psychologii i matematyki. Został zaprojektowany tak, aby korzystanie z wyszukiwarki Google z dowolnego miejsca na telefonie było bardziej naturalne, poprzez wykonanie kilku czynności, takich jak najeżdżanie kursorem, wyróżnianie, pisanie lub dotykanie. Aha, i miło jest móc pomagać dzieciom w odrabianiu zadań domowych bezpośrednio z obsługiwanych telefonów i tabletów z Androidem. Czytaj więcej
Jenkit z bazy ogniowej
Platforma Firebase ma nowy dodatek o nazwie Firebase Genkit, którego celem jest ułatwienie programistom tworzenia aplikacji opartych na sztucznej inteligencji w JavaScript/TypeScript, a wkrótce będzie dostępna obsługa Go. Jest to platforma typu open source korzystająca z licencji Apache 2.0, która umożliwia programistom szybkie wbudowywanie sztucznej inteligencji w nowe i istniejące aplikacje.
Niektóre z przypadków użycia, które firma GenKit przedstawi we wtorek, obejmują kilka standardowych przypadków użycia GenAI: generowanie i podsumowywanie treści, tłumaczenie tekstu i generowanie obrazów. Czytaj więcej
Będziemy aktualizować ten post przez cały dzień…
„Zły introwertyk. Fan mediów społecznościowych. Irytująco skromny myśliciel. Miłośnik kawy. Ekspert od alkoholu. Internetowy geek”.