"Powstanie Warszawskie AI" – to nazwa nagrania wideo wygenerowanego przy użyciu sztucznej inteligencji na podstawie zdjęć wykonanych podczas zrywu 80 lat temu. Filmik można zobaczyć w mediach społecznościowych m.in. na facebookowym profilu Historical Colors. Jest to inicjatywa stworzona przez fotografa Mariusza Zająca.
Nagranie zostało opublikowane o godz. 23:57 w nocy z 31 lipca na 1 sierpnia. Jak wyjaśnia autor wideo, filmik trwa trzy minuty, więc po obejrzeniu go natychmiast po premierze na zegarach wybiła północ i rozpoczął się 1 sierpnia.
Wideo zostało wygenerowane przy użyciu płatnego oprogramowania opartego o AI. Do stworzenia nagrania użyto koloryzowanych wcześniej zdjęć z Powstania Warszawskiego.
Do każdego z kilkudziesięciu takich fotografii autor musiał dodać opis (tzw. prompta), w którym po angielsku sformułował to, co - jego zdaniem - mogło wydarzyć się w momencie wykonywania danej fotografii. Sztuczna inteligencja wygenerowała dla każdego zdjęcia kilkusekundowe nagranie wideo. Następnie wszystkie powstałe w ten sposób filmiki zostały złożone w jeden, trwający 3 minuty.
Jak mówi Mariusz Zając w rozmowie z RMF FM, zamiar przygotowania takiego projektu miał on już od dawna, ale nie miał możliwości jego realizacji.
Pomysł na film, w którym "uruchomię" statyczne zdjęcia, miałem już od dawna - po lekturze bloga Google o AI, w którym już jakieś dwa lata temu pisano, że pracują nad algorytmem umożliwiającym animacje. Zaprezentowali już wtedy przykład placu zabaw i wygenerowanego ujęcia, który wyglądał jakby ktoś to nakręcił, chodząc wokół tego miejsca. To rozpaliło moją wyobraźnię o stworzeniu filmu ze zdjęć - wspomina.
Podkreśla, że podejmował wcześniej próby animacji zdjęć, ale "wyniki nie były nawet trochę zadawalające". Czekałem na pokazujące się kolejne projekty AI, które podejmują się takich zadań - dodaje. I doczekał się.
Jak podkreśla w rozmowie z RMF FM Mariusz Zając, "animacja przy użyciu AI wcale nie jest taka prosta, jak się początkowo wydawało".
Problem nie leży w samej animacji, tylko w nauce komunikacji z tą mechaniką. AI ma skłonności do tzw. efektu halucynacji, czyli nadinterpretowania obrazu, co często daje dziwne, straszne lub śmieszne efekty. Należy pamiętać, że każda animacja jest unikalna i nie do powtórzenia - wyjaśnia.
Podkreśla, że ta wyjątkowość "jest z jednej strony dobra, bo za każdym razie mamy inny wynik, ale z drugiej strony irytująca, ponieważ jeżeli popełnimy błąd i wyjdzie nam w 90 proc. poprawna animacja, to jej nie jesteśmy w stanie powtórzyć i naprawić".
Przykładem takich sytuacji jest np. animacja tramwaju na moście w przedwojennej Warszawie, gdzie nagle nieproszony zza tramwaju wyłania się współczesny samochód typu mercedes. Następnym razem samochodu nie ma, ale tramwaj wyjeżdża z torów. Zanim udało mi się uzyskać akceptowalną wizualnie animację, była ona poprzedzona wręcz kilkunastoma nietrafionymi próbami - mówi Mariusz Zając.
Jak zaznacza, "błędów nie udało się pozbyć, bo one są także w prezentowanym filmie - tyle że wybrane sceny są scenami z najmniej rzucającymi się w oczy błędami w stosunku do innych, które udało się stworzyć".
AI nie radzi sobie jeszcze z głowami ludzi, zwłaszcza gdy są one tylko fragmentem większej sceny. Nie wiem, czy to nie wynika to z tego, że zdjęcia źródłowe są jednak słabej jakości, mają wiele niedoskonałości - stwierdza twórca nagrania.
Inną inicjatywą Mariusza Zająca jest - powstałe w taki sam sposób, jak "Powstanie Warszawskie AI" - nagranie na podstawie zdjęć stolicy z lat 1910-1945. Więcej informacji o tym znajdziecie TUTAJ.
Jak wówczas mówił twórca, zaskoczyła go popularność tego nagrania. Są skrajne opinie - od zachwytu nad technologią, po zarzuty o manipulację - mówił.
Zaznaczył jednak, że w zdecydowanej większości opinie są pochlebne.