Przejdź do treści
Reklama
Reklama
Nauka

Sora zachwyca i przeraża. AI tworzy spektakularne wideo tylko na podstawie tekstu

Sora, nowe narzędzie od OpenAI Sora, nowe narzędzie od OpenAI Rafael Henrique / Zuma Press / Forum
Sora, nowy produkt OpenAI, zaszokował świat swoimi możliwościami. Mimo powszechnych zachwytów warto zachować dozę sceptycyzmu.

Po słynnym ChatGPT, który kreuje „inteligentne” teksty, DALL-E malującym obrazy według krótkiego opisu – przyszedł czas na filmy. OpenAI, kalifornijski ośrodek badawczy sztucznej inteligencji (i komercyjna firma), właśnie zaprezentował swój kolejny przełomowy produkt. Jego nazwa – Sora – pochodzi od japońskiego słowa oznaczającego niebo. Ma to zapewne sugerować, że w przypadku kreatywności sztucznej inteligencji „only sky is the limit”.

Sora. Kobieta idzie tokijską ulicą...

Sora opiera się na dużym modelu językowym (podobnie jak ChatGPT czy Gemini Google’a), czyli zaawansowanym programie komputerowym zaprojektowanym do analizy, generowania i „rozumienia” ludzkiego języka naturalnego. Posiada jednak dodatkową umiejętność: tworzenia filmów na podstawie wpisywanych przez ludzi tekstów. Choć nie jest czymś zupełnie nowym, bo tego typu programy istnieją już od pewnego czasu, to OpenAI zaskoczyło realizmem i bardzo wysoką jakością wideo tworzonych przez sztuczną inteligencję.

Oto przykład jednej z zaprezentowanych przez kalifornijską firmę produkcji. Sora otrzymała zadanie stworzenia obrazu wideo na podstawie następującego tekstu (tzw. promptu):

Elegancko ubrana kobieta idzie tokijską ulicą pełną ciepło migoczących neonów i szyldów. Ubrana jest w czarną skórzaną kurtkę, długą czerwoną sukienkę i czarne buty, a do tego trzyma czarną torebkę. Nosi okulary przeciwsłoneczne, a usta ma pomalowane czerwoną szminką. Idzie pewnie i swobodnie. Ulica jest mokra, więc powstają na niej lustrzane odbicia kolorowych neonów.

Reklama