Sora zachwyca i przeraża. AI tworzy spektakularne wideo tylko na podstawie tekstu

18 lutego 2024

Sora, nowe narzędzie od OpenAI Rafael Henrique / Zuma Press / Forum

Sora, nowy produkt OpenAI, zaszokował świat swoimi możliwościami. Mimo powszechnych zachwytów warto zachować dozę sceptycyzmu.

Po słynnym ChatGPT, który kreuje „inteligentne” teksty, DALL-E malującym obrazy według krótkiego opisu – przyszedł czas na filmy. OpenAI, kalifornijski ośrodek badawczy sztucznej inteligencji (i komercyjna firma), właśnie zaprezentował swój kolejny przełomowy produkt. Jego nazwa – Sora – pochodzi od japońskiego słowa oznaczającego niebo. Ma to zapewne sugerować, że w przypadku kreatywności sztucznej inteligencji „only sky is the limit”.

Sora. Kobieta idzie tokijską ulicą...

Sora opiera się na dużym modelu językowym (podobnie jak ChatGPT czy Gemini Google’a), czyli zaawansowanym programie komputerowym zaprojektowanym do analizy, generowania i „rozumienia” ludzkiego języka naturalnego. Posiada jednak dodatkową umiejętność: tworzenia filmów na podstawie wpisywanych przez ludzi tekstów. Choć nie jest czymś zupełnie nowym, bo tego typu programy istnieją już od pewnego czasu, to OpenAI zaskoczyło realizmem i bardzo wysoką jakością wideo tworzonych przez sztuczną inteligencję.

Oto przykład jednej z zaprezentowanych przez kalifornijską firmę produkcji. Sora otrzymała zadanie stworzenia obrazu wideo na podstawie następującego tekstu (tzw. promptu):

Elegancko ubrana kobieta idzie tokijską ulicą pełną ciepło migoczących neonów i szyldów. Ubrana jest w czarną skórzaną kurtkę, długą czerwoną sukienkę i czarne buty, a do tego trzyma czarną torebkę. Nosi okulary przeciwsłoneczne, a usta ma pomalowane czerwoną szminką. Idzie pewnie i swobodnie. Ulica jest mokra, więc powstają na niej lustrzane odbicia kolorowych neonów. Kobietę mijają przechodnie.

Co wykreowała, można podziwiać tutaj:

Prompt: “A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. she wears a black leather jacket, a long red dress, and black boots, and carries a black purse. she wears sunglasses and red lipstick. she walks confidently and casually.… pic.twitter.com/cjIdgYFaWq
— OpenAI (@OpenAI) February 15, 2024

OpenAI udostępniło również inne filmy stworzone przez sztuczną inteligencję na bazie promptów (w sumie 10 minut materiału):

Ich tematyka jest bardzo różnorodna: od mamutów po nadmorskie klify czy krótki obraz science fiction.

Najmłodsze dziecko OpenAI

Zachwycając się produkcjami Sory, warto jednak zachować (przynajmniej na razie) sceptycyzm wobec możliwości najmłodszego dziecka OpenAI. Nie wiadomo bowiem, jakie w rzeczywistości one są. Firma nie udostępniła Sory licznym użytkownikom (jedynie grupie testerów), więc np. można się tylko domyślać, jak często i jak bardzo program halucynuje. Na razie problemu tego (podawania zmyślonych informacji) nie udało się wyeliminować w żadnym z dostępnych powszechnie dużych modeli językowych (nie tylko ChatGPT, ale również Gemini), więc z pewnością dotyczy on również najnowszego produktu OpenAI.

Nie wiadomo też, czy i jak dobrze Sora „rozumie” zasady rządzące realnym światem, tzn. czy nie kreuje obiektów łamiących prawa fizyki (chyba że zostanie o to poproszona). W niemal każdym z udostępnionych filmików można dopatrzyć się tego typu nieścisłości, np. przechodnie poruszają się nie jak ludzie, ale trochę jak zombie, lub obiekty się przenikają, jakby były duchami. Oczywiście takie niedoróbki mogą być tylko „chorobą wieku dziecięcego”, a program będzie doskonalony.

Fascynująco i przerażająco

OpenAI (pomimo swojej nazwy) tradycyjnie nie ujawnił, za pomocą jakich danych trenował swój model. Sporo komentatorów spekuluje, że prawdopodobnie pracował m.in. na licznych materiałach generowanych przez silniki graficzne gier (czyli programy do tworzenia wirtualnych światów), takie jak Unreal. Być może też korzystano z nagrań z YouTube’a i innych filmów chronionych prawem autorskim. Może to rodzić problemy analogiczne do podniesionych w pozwie przeciw OpenAI wniesionym do sądu przez dziennik „New York Times” pod koniec ubiegłego roku.

Kolejna kwestia: imponujące wideo Sory są bardzo krótkie. Ciekawe więc, czy i kiedy będzie potrafiła tworzyć dłuższe. I ile czasu (oraz zasobów obliczeniowych) będzie to zabierać. To rodzi pytania o możliwości dostępu do programu i szerokiego korzystania z niego przez internautów w przyszłości.

Jeśli Sora stanowi jedynie skromną zapowiedź tego, co nas czeka, to przyszłość zapowiada się i fascynująco, i przerażająco. Z jednej bowiem strony ludzie dostaną do ręki narzędzie uwalniające kreatywność. Niemal każdy będzie mógł tworzyć filmy według najbardziej niezwykłych własnych pomysłów. Rodzi to jednak również pytania o przyszłość i kształt branży filmowej czy reklamowej. Oraz, last but not least, kwestie związane z propagandą, fake newsami czy pornografią. Lista, co potencjalnie złego dałoby się zrobić dzięki Sorze, jest z pewnością długa. Dlatego OpenAI będzie musiała ostrożnie udostępniać swój nowy program i zapewne nałoży na niego jakieś ograniczenia.

Marcin Rotkiewicz

Absolwent dziennikarstwa i filozofii na Uniwersytecie Warszawskim oraz stypendysta Knight Science Journalism Program w Massachusetts Institute of Technology. Popularyzuje wiedzę przede wszystkim na temat biotechnologii, ewolucji naczelnych i neuronauki. Interesuje się również teoriami pseudonaukowymi i spiskowymi. Dwukrotnie nominowany do Nagrody Grand Press w kategoriach dziennikarstwo specjalistyczne i publicystyka. Autor wywiadów rzek: z prof. Jerzym Vetulanim „Mózg i błazen” oraz z prof. Bogdanem Wojciszke „Homo nie całkiem sapiens”. Napisał również „W królestwie Monszatana. GMO, gluten i szczepionki”, za którą otrzymał nagrodę redaktorów portalu Mądre Książki. Dziennikarz działu Nauka/projektpulsar.pl.

Więcej na ten temat

Wiarygodność w czasach niepewności

Wypróbuj za 11,90 zł!

Sora zachwyca i przeraża. AI tworzy spektakularne wideo tylko na podstawie tekstu

Sora. Kobieta idzie tokijską ulicą...

Najmłodsze dziecko OpenAI

Fascynująco i przerażająco

Marcin Rotkiewicz

„New York Times” pozywa OpenAI i Microsoft. Proces byłby bez precedensu

Frankenstein otwiera oczy. Prof. Mądry dla „Polityki”: AI może nas wzmocnić. Ale zabije, jeśli nic nie zrobimy

Ajajaj AI. Jak się rozwinie, co nas czeka? Tego rzeczywiście można się bać

AGI: trzy litery, które wstrząsną światem. Nadciąga ogólna sztuczna inteligencja

Rok 2024: symulacja przyszłości. Co nas czeka w świecie nowych technologii

Czas sus, czyli jak staliśmy się podejrzliwi. W 2023 r. ciągle dawaliśmy się wodzić za nos

Czy AI zastąpi lekarzy? Pomoże wykrywać nowotwory? Nadciąga rewolucja

Zdjęcie czy AI. Dlaczego coraz trudniej wyłapać różnice?

Najczęściej czytane w sekcji Nauka

Za dużo leków, diagnoz depresji, autyzmu i ADHD? Wielki spór w psychiatrii

Zmarł Daniel Dennett, wybitny filozof. „Każdy powinien siebie pytać: a co, jeśli nie mam racji?”

Skąd się wzięło życie na Ziemi? Badacze teorie mają dwie. Ekscytujące i sprzeczne

Jak wyglądałaby Polska, gdyby nie było tu ludzi. I dlaczego warto o tym pomyśleć

Badacze coraz częściej sięgają po AI. Efekty zachwycają. I poważnie niepokoją

Czytaj także

Łomot, wrzaski i deskorolkowcy. Czasem pijani. Hałas może zrujnować życie

Kolejny zjazd Lewicy. Tkwi w pułapce, a przed nią scenariusze złe i jeszcze gorsze

Ustalenia „Polityki”: Rektor UW zarabia wielkie pieniądze jako doradca odwołanej prezeski PZU. I trudno go zwolnić

„Fallout”: makabryczny serial o atomowej zagładzie. Strach się śmiać!

Dlaczego książki drożeją, a księgarnie upadają? Na rynku dzieje się coś dziwnego

Zmarł Daniel Dennett, wybitny filozof. „Każdy powinien siebie pytać: a co, jeśli nie mam racji?”

Dlaczego tak późno? Marian Turski w 80. rocznicę wybuchu powstania w getcie warszawskim

Dzieje polskiej wsi. Zamów już dziś najnowszy Pomocnik Historyczny „Polityki”

Kaczyński się pozbierał, złapał cugle, zagrożenie nie minęło. Czy PiS jeszcze wróci do władzy?

O motywacji wewnętrznej i zewnętrznej

O co ta burza nad kładką w Warszawie. Spacerowicze zachwyceni, internet zapłonął ze złości

Czy człowiek mordujący psa zasługuje na karę śmierci? Daniela zabili, ciało zostawili w lesie

Czy żyjemy w antropocenie? Naukowcy już mieli to ogłosić. I wtedy wybuchła bomba