Sam Altman przypomniał wszystkim, dlaczego OpenAI jest liderem

Sam Altman, dyrektor generalny OpenAI, zaprezentował model przetwarzania tekstu na wideo o nazwie Sora.
Justina Sullivana

  • Sam Altman po raz kolejny zadziwił branżę AI.
  • W czwartek OpenAI zaprezentowało swój nowy model konwersji tekstu na wideo, Sora.
  • Zdolność Sory do tworzenia filmów w wysokiej rozdzielczości zszokowała Internet.

Sam Altman zadziwił branżę AI. jeszcze raz.

Tym razem nie jest to wina A Szokujące wydalenie z OpenAINie jest to też spowodowane czymś z tym związanym CzatGPT. Zamiast tego jest to zasługa zupełnie nowego modelu sztucznej inteligencji o nazwie Sora.

Czwartek jest Przedstawił światu Soręktórego nazwa pochodzi od japońskiego słowa oznaczającego „niebo”, umożliwia tworzenie filmów wideo o długości do jednej minuty.

OpenAI twierdzi, że jego celem jest Sora Ma nauczyć sztuczną inteligencję, jak „rozumieć i symulować poruszający się świat fizyczny, w celu szkolenia modeli, które pomogą ludziom rozwiązywać problemy wymagające interakcji w świecie rzeczywistym”.

To trochę nudny sposób na opisanie tego, co model faktycznie potrafi. Może tworzyć filmy w wysokiej rozdzielczości przedstawiające wszystko, od Kalifornii podczas XIX-wiecznej gorączki złota po animacje 3D podobne do produkcji Dreamworks. Jedyne, o co cię poprosi, to prosta wiadomość tekstowa.

Warto zaznaczyć, że nie jest to pierwszy przypadek tego typu technologii.

Nowojorski start-up Runway, wspierany przez Google i Nvidię, dysponuje narzędziem opartym na sztucznej inteligencji, które tworzy wideo z tekstu. Meta ma coś podobnego o nazwie Film emo. W zeszłym miesiącu Google zaprezentowało swoją wersję konwersji tekstu na wideo o nazwie Lumiere.

Czy szum wokół nich jest porównywalny z szumem wokół Sory? nie dokładnie.

Dzieje się tak częściowo dlatego, że kierownictwo Altmana jest własnością prywatną OpenAI Daje mu to swobodę promowania tej technologii – mimo że nadal jest ona testowana pod kątem ewentualnych szkód. (Uwaga: zwolnienie Sory jest ograniczone do „członków Drużyny Czerwonych”, którzy poddadzą go testowi ryzyka, a także wybranych artystów wizualnych i filmowców.)

READ  Istnieje naukowy powód, dla którego zawodnicy Elden Ring kopią ci tyłek

Dlatego też jego ogłoszenie o Sorze w mediach społecznościowych nie tylko zawierało hiperłącze do bloga wyjaśniającego nowy model sztucznej inteligencji; Wymagało to bezpośredniej interakcji z ludźmi, którzy go śledzili.

W X otrzymywał szybkie prośby od użytkowników dotyczące filmów, które chcieli obejrzeć, stworzonych przez Sorę.

„Chcielibyśmy pokazać Ci, co potrafi Sora. Prześlij nam napisy do filmów, które chcesz obejrzeć, a my zaczniemy je tworzyć!” on napisał. Napływały prośby.

Osobowość internetowa MrBeast poprosiła go o nagranie wideo Małpa gra w szachy w parku. Inny poprosił o obejrzenie Golden retrievery transmitujące w górach. Dyrektor generalny Nothing, Carl Pei, poprosił o film przedstawiający Willa Smitha jedzącego spaghetti. Zrobiło to także wiele innych osób.

Media nieobsługiwane przez AMP.
Kliknij, aby uzyskać pełną wersję mobilną.

Nikunj Kothari, partner w Khosla Ventures, podkreślił wpływ strategii Altmana, porównując ją ze sposobem, w jaki zaangażował się Google Ogromna aktualizacja modelu AI Geminiza pośrednictwem wpisu na blogu z tego samego dnia, w którym wypuszczono Sorę.

Google ogłasza coś niesamowitego Powiedział w dniu X, rozszerzając „okno kontekstowe” Gemini – liczbę słów, które model sztucznej inteligencji może przetworzyć wokół symbolu docelowego – nawet o 1 milion. To ogromny postęp, ale takiego postępu Google nie oferuje jak Altman.

„Nie ma placu zabaw, nie mogę sam tego spróbować. W poście na blogu znajduje się kilka imponujących filmów, ale w ogóle nie są one przeznaczone dla mnie” – napisał Kothari w X, podkreślając, że Altman „demonstruje” umiejętności Sory przez Otrzymuj prośby od innych.

„To w dużej mierze przyćmi imponujące osiągnięcia Google. Google pozostaje w tyle i musi „kupić”, aby ponownie uchwycić wymianę poglądów” – stwierdził Kothari.

Jednak ten szum może nie trwać długo.

Wypuszczenie modelu sztucznej inteligencji zdolnego do tworzenia imponujących filmów może stworzyć nowe zagrożenia dla branży kreatywnej, która już wzbudziła obawy, czy generatywna sztuczna inteligencja będzie w stanie przejąć ich miejsca pracy. Po strajkach, których w zeszłym roku było świadkiem Hollywood.

READ  NEO: The World Ends with You jest już dostępny na Steam

Powszechne przyjęcie tej technologii może również siać spustoszenie w tegorocznych wyborach, jeśli zostanie wykorzystana przez złych aktorów, którzy chcą stworzyć fałszywe filmy wideo, na przykład Donalda Trumpa czy Joe Bidena.

Prawdopodobnie doprowadzi to również do ponownego żądania od OpenAI przejrzystości w zakresie danych wykorzystywanych do uczenia swoich modeli w taki sam sposób, w jaki ma to miejsce w przypadku modeli open source.

Ale na razie ludzie kupują szum Altmana.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *