Google I/O 2024: jak dotąd ogłoszono wszystko

To moment, na który czekałeś cały rok: Dzień Google I/O! Google co roku rozpoczyna konferencję dla programistów od lawiny ogłoszeń ujawniających najnowsze rzeczy. Briana Już ośmieszyliśmy się, dzieląc się tym, czego oczekujemy.

Wiemy, że nie zawsze masz czas, aby obejrzeć całą dzisiejszą dwugodzinną prezentację, więc nie spieszmy się, ponieważ ogłaszamy szybkie hity z najważniejszych nagłówków wiadomości. Przystępna i łatwa do usunięcia lista. Oto jest!

Piksel 8a

Aktualizacja ekranu 8-calowego Pixela
Źródło obrazu: Google

Google nie może się doczekać, aż we/wy zaprezentuje najnowszy dodatek do linii Pixel i ogłosił w zeszłym tygodniu nowego Pixela 8a. Telefon będzie dostępny w cenie od 499 dolarów i będzie dostępny we wtorek. Aktualizacje i czego się po nich spodziewamy. Na szczycie listy znajduje się układ Tensor G3. Czytaj więcej

Łupek pikseli

Źródło obrazu: Briana Heatera

Tablet Google Pixel o nazwie Slate jest już dostępny. Jeśli pamiętasz, Brian recenzował tablet Pixel mniej więcej w zeszłym roku i mówił tylko o podstawach. Co ciekawe, tablet dostępny jest bez niego. Czytaj więcej

Poproś o zdjęcia

Źródło obrazu: TechCrunch

Zdjęcia Google otrzymają zastrzyk sztucznej inteligencji wraz z uruchomieniem eksperymentalnej funkcji o nazwie Zapytaj Zdjęcia obsługiwanej przez model AI Gemini firmy Google. Nowy dodatek, który zostanie wprowadzony jeszcze tego lata, umożliwi użytkownikom przeszukiwanie kolekcji Zdjęć Google przy użyciu zapytań w języku naturalnym, które wykorzystują sztuczną inteligencję do zrozumienia treści zdjęć i innych metadanych.

Dzięki przetwarzaniu języka naturalnego optymalizacja AI sprawi, że znajdowanie odpowiednich treści będzie bardziej intuicyjne i skróci proces ręcznego wyszukiwania, zanim użytkownicy będą szukać konkretnych osób, miejsc lub rzeczy na swoich zdjęciach.

A przykład był piękny. „Złote paski?” Kto nie kocha duetu tygrysów i golden retrieverów wypchanego tygrysem? Czytaj więcej

Wszystko o Bliźniakach

Źródło obrazu: TechCrunch

Bliźnięta 1.5 Pro: Kolejnym ulepszeniem generatywnej sztucznej inteligencji jest to, że Gemini może teraz analizować dłuższe dokumenty, bazy kodów, filmy i nagrania audio niż kiedykolwiek wcześniej.

Prywatna zapowiedź nowej wersji obecnego flagowego modelu firmy, Gemini 1.5 Pro, ujawniła, że ​​może ona pomieścić aż 2 miliony tokenów. To ponad dwukrotnie więcej niż poprzednia maksymalna kwota. Na tym poziomie nowa wersja Gemini 1.5 Pro obsługuje największy wkład spośród wszystkich dostępnych na rynku modeli. Czytaj więcej

READ  Rosjanie już boją się awansować w Piłohoriwce i nie przedzierają się przez pączki Shivarsky

Bliźnięta na żywo: Firma udostępniła w Gemini nową usługę o nazwie Gemini Live, która umożliwia użytkownikom prowadzenie „głębszych” rozmów głosowych z Gemini na smartfonach. Użytkownicy mogą przerywać Gemini podczas mówienia chatbota, zadając pytania wyjaśniające, a on dostosowuje się w czasie rzeczywistym do ich wzorców mowy. Gemini może widzieć otoczenie użytkowników i reagować na nie za pomocą zdjęć lub filmów zarejestrowanych aparatami w smartfonach.

Na pierwszy rzut oka Live nie wydaje się drastycznym ulepszeniem istniejącej technologii. Google twierdzi jednak, że wykorzystuje nowe techniki z dziedziny generatywnej sztucznej inteligencji, aby zapewnić lepszą, mniej podatną na błędy analizę obrazu, i łączy te techniki z ulepszonym silnikiem mowy, aby zapewnić bardziej spójną, ekspresyjną emocjonalnie i realistyczną wieloobrotową rozmowę. Czytaj więcej

Bliźnięta Nano: Teraz małe ogłoszenie. Google buduje najmniejszy ze swoich modeli sztucznej inteligencji, Gemini Nano, bezpośrednio w kliencie stacjonarnym Chrome, zaczynając od Chrome 126. Jak twierdzi firma, umożliwi to programistom wykorzystanie modelu na urządzeniu do wdrożenia własnych funkcji sztucznej inteligencji. Na przykład Google planuje wykorzystać tę nową funkcję do ulepszenia funkcji, takich jak istniejące narzędzie „Pomóż mi pisać” z Workspace Lab w Gmailu. Czytaj więcej

Bliźnięta na Androidzie: Google Gemini na Androida, zastępujący sztuczną inteligencję Asystenta Google, wkrótce wykorzysta swoją zdolność do głębokiej integracji z mobilnym systemem operacyjnym Android i aplikacjami Google. Użytkownicy mogą przeciągać i upuszczać obrazy wygenerowane przez sztuczną inteligencję bezpośrednio do Gmaila, Wiadomości Google i innych aplikacji. Tymczasem Google twierdzi, że użytkownicy YouTube mogą kliknąć „Posłuchaj tego filmu”, aby znaleźć określone informacje na temat tego filmu na YouTube. Czytaj więcej

Bliźnięta w Mapach Google: Możliwości modelu Gemini zaczynają się od platformy Google Maps i interfejsu API Places dla programistów. Programiści mogą tworzyć podsumowania miejsc i regionów oparte na sztucznej inteligencji we własnych aplikacjach i witrynach internetowych. Podsumowania opierają się na przeprowadzonej przez Gemini analizie spostrzeżeń społeczności Map Google, liczącej ponad 300 milionów autorów. Co jest lepsze? Deweloperzy nie muszą już pisać niestandardowych opisów własnych lokalizacji. Czytaj więcej

READ  Foxconn protestuje: fabryka iPhone'ów płaci pracownikom za wyjście i opuszczenie kampusu Zhengzhou

Jednostki przetwarzające Tensor uzyskują zwiększoną wydajność

Google zaprezentowało kolejną generację – dokładnie szóstą – chipów AI Tensor Processing Units (TPU). Nazywane Trillium, zostaną wprowadzone na rynek jeszcze w tym roku. Jeśli pamiętacie, tradycją I/O jest ogłaszanie nowej generacji TPU, a chipy pojawią się dopiero w dalszej części roku.

Te nowe TPU będą miały 4,7-krotny wzrost wydajności obliczeniowej na chip w porównaniu z piątą generacją. Co ważniejsze, Trillium zawiera Sparscore trzeciej generacji, który Google opisuje jako „specjalistyczny akcelerator do przetwarzania bardzo dużych osadzonych elementów, powszechnych w zaawansowanych obciążeniach związanych z rankingami i rekomendacjami”. Czytaj więcej

AI w wyszukiwaniu

Rozwiawszy podejrzenia, że ​​firma traci udział w rynku na rzecz konkurentów takich jak ChatGPT i Perplexity, Google dodaje więcej sztucznej inteligencji do swojego wyszukiwania. Udostępnia użytkownikom w USA przeglądy oparte na sztucznej inteligencji. Ponadto firma ma nadzieję wykorzystać Gemini jako agenta do takich celów, jak planowanie podróży. Czytaj więcej

Google planuje wykorzystać generatywną sztuczną inteligencję do uporządkowania całej strony wyników wyszukiwania dla określonych wyników. Stanowi to dodatek do istniejącej funkcji przeglądu AI, która tworzy krótki fragment zawierający zbiorcze informacje na temat, którego szukasz. Funkcja przeglądu AI jest zwykle dostępna we wtorek po pracy nad programem AI Labs firmy Google. Czytaj więcej

Kreatywne ulepszenia AI

Obraz Google 3

Google ogłosiło Image 3, najnowszy z rodziny modeli AI od technologicznego giganta Image.

Demis Hassabis, szef DeepMind, działu Google zajmującego się badaniami nad sztuczną inteligencją, powiedział, że Image3 lepiej przekształca tekst w obrazy niż jego poprzednik, Image2, i jest najbardziej „kreatywną i wszechstronną” ze swoich generacji. Ponadto model generuje mniej „rozpraszających artefaktów” i błędów – dodał.

„Ten [also] „Nasz najlepszy model renderowania tekstu stanowi wyzwanie dla modeli renderowania obrazów” – dodał Hassabis. Czytaj więcej

Aktualizacje Gemmy 2

Gemma 2, następna generacja modeli Google Gemma, zostanie wypuszczona na rynek w czerwcu z modelem o 27 miliardach parametrów. Czytaj więcej

Projekt IDX

Project ITX, opracowane przez firmę środowisko programistyczne nowej generacji, oparte na sztucznej inteligencji i oparte na przeglądarce, jest obecnie w fazie otwartej wersji beta. Dzięki tej aktualizacji środowisko IDE integruje się z platformą Map Google, ułatwiając dodawanie funkcji geolokalizacji do aplikacji, a także integruje się z narzędziami Chrome Dev Tools i Lighthouse, aby ułatwić debugowanie aplikacji. Wkrótce Google umożliwi także wdrażanie aplikacji w Cloud Run, bezserwerowej platformie Google Cloud, w celu uruchamiania usług front-end i back-end. Czytaj więcej

READ  Izraelskie zdjęcia satelitarne pokazują szybki wzrost liczby rosyjskich sił zbrojnych na Krymie

Weo

Google oszukuje Sorę OpenAI za pomocą View, modelu AI, który może tworzyć klipy wideo w rozdzielczości 1080p. Veo może rejestrować różnorodne style wizualne i filmowe, w tym sceny krajobrazów i poklatkowe, a także wprowadzać edycje i zmiany w już utworzonych scenach.

Opiera się także na wstępnych komercyjnych pracach Google nad tworzeniem wideo, których premiera miała miejsce w kwietniu, podczas których wykorzystano rodzinę modeli do tworzenia zdjęć Image 2 do tworzenia zapętlonych klipów wideo. Czytaj więcej

Zakreśl, aby wyszukać

Osoba trzymająca telefon korzystająca z Google Circle do wyszukiwania

Oparta na sztucznej inteligencji funkcja Circle to Search, która pozwala użytkownikom Androida uzyskiwać natychmiastowe odpowiedzi za pomocą gestów takich jak kręcenie, może teraz rozwiązywać bardziej złożone problemy z zakresu psychologii i matematyki. Został zaprojektowany tak, aby korzystanie z wyszukiwarki Google z dowolnego miejsca na telefonie było bardziej naturalne, poprzez wykonanie kilku czynności, takich jak najeżdżanie kursorem, wyróżnianie, pisanie lub dotykanie. Aha, i miło jest móc pomagać dzieciom w odrabianiu zadań domowych bezpośrednio z obsługiwanych telefonów i tabletów z Androidem. Czytaj więcej

Jenkit z bazy ogniowej

Platforma Firebase ma nowy dodatek o nazwie Firebase Genkit, którego celem jest ułatwienie programistom tworzenia aplikacji opartych na sztucznej inteligencji w JavaScript/TypeScript, a wkrótce będzie dostępna obsługa Go. Jest to platforma typu open source korzystająca z licencji Apache 2.0, która umożliwia programistom szybkie wbudowywanie sztucznej inteligencji w nowe i istniejące aplikacje.

Niektóre z przypadków użycia, które firma GenKit przedstawi we wtorek, obejmują kilka standardowych przypadków użycia GenAI: generowanie i podsumowywanie treści, tłumaczenie tekstu i generowanie obrazów. Czytaj więcej

Będziemy aktualizować ten post przez cały dzień…

Przeczytaj więcej o Google I/O 2024 w TechCrunch

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *