Nr 24/2022 Na dłużej

Poznawczy speedball, outsource wyobraźni

Aleksandra Skowrońska
Społeczeństwo Sztuka

Wasza wyobraźnia została zredukowana do fundamentalistycznego realizmu, […] realizmu-rywalizacji w kwestii stylu – kto się najnudniej ubierze, kto będzie najbardziej uprzejmy i najmniej obraźliwy w rozmowie. Kto zamieści najnudniejsze zdjęcia w internecie. […] Powołujecie się na wasze wyższe wykształcenie, ale wygląda na to, że szkoła, do której chodziliście, była GŁUPIA. Nawet nie zdajecie sobie z tego sprawy – kapitalizm olał was na rzecz budowania kultury totalnej nijakości.

Martine Syms w „Soliloquy” (2021) nazywa rzeczy po imieniu. Nie ma już czasu na półśrodki, gdy nastał kryzys wyobraźni. Jesteśmy przesyceni, „przedawkowani” mimikrycznymi treściami – produkowanymi w takim nadmiarze, że nie ma już możliwości ich przetrawienia. Jak czytamy w niedawno przetłumaczonym na język polski eseju „Prywatyzacja stresu” Marka Fishera:

Przyśpieszenie wymiany informacji […] oddziałuje na umysł jednostki w patologiczny sposób, a nawet mocniej na umysł kolektywny. Jednostki nie są w stanie świadomie przetworzyć ogromnej i zawsze rosnącej masy informacji, jaka trafia do ich komputerów, telefonów komórkowych, telewizorów, elektronicznych kalendarzy oraz głów. Mimo to śledzenie, rozpoznawanie, ocenianie i przetwarzanie wszystkich tych danych wydaje się nieodzowne, jeśli chcesz być wydajny, konkurencyjny, zwycięski.

Kompulsywne wchłanianie treści powiązane z jednoczesną niemożnością ich przyswojenia owocuje marazmem – niekończącym się stanem niepewności i niepokoju. Marazm ten – chciałoby się rzec z ironią: tak się akurat złożyło – przypada na czas jednych z najbardziej nieprzewidywalnych w historii wydarzeń na skalę globalną i planetarną. Tym poznawczym speedballem raczeni jesteśmy, będąc jednocześnie zwróceni w stronę nieuchronnie nadchodzącej przyszłości, którą coraz trudniej jest sobie wyobrazić.

Kiedy więc po raz pierwszy usłyszałam, jak w wideo „Propozycja dla telewizji publicznej: DEEP NEWS” duet Eternal Engine uprasza: „Szanowni Państwo, zapnijcie pasy, gdyż nie wiemy, dokąd zmierzamy”, a latem tego roku Kasper Lecnim w Zachęcie na szeroko komentowanej wystawie „Niepokój przychodzi o zmierzchu” – pokoleniowym przeglądzie młodych polskich artystów – oznajmił z dezynwolturą, że „Świat się wali, a ja walę konia”, pomyślałam: a więc to tak będzie wyglądał koniec świata! Dotychczasowemu kształtowi rzeczywistości akompaniował będzie splot witalnego nihilizmu i swojskiego akceleracjonizmu (bynajmniej nie z wyobrażeń Srnicka – raczej z uniwersum Świata Według Kiepskich z dominującą, łagodną akceptacją nieuchronności własnej porażki).

Gdy więc patrzyliśmy na krajobraz zdominowanego kryzysami złowieszczego realizmu i kontemplowaliśmy własny koniec, na horyzoncie w czasie tegorocznego letniego przesilenia zamigotała popularność nieludzkich aktorów dysponujących własną, niezmęczoną jeszcze wyobraźnią. Chodzi o generatory, takie jak DALL-E i Midjourney – aplikacje wytwarzające obrazy na podstawie wprowadzonych przez użytkownika opisów tekstowych (text-to-image) opartych na otwartym kodzie źrodłowym. Viralowy trend, którego owoce zasypywały wakacyjne feedy, stał się szybko zjawiskiem o znaczeniu kulturowym. Dla wielu użytkowników było to pierwsze zetknięcie się z tak zwaną sztuczną inteligencją – zetknięcie, dodajmy, dość przyjemne, bo oparte na dostarczaniu algorytmowi treści tekstowych do wizualnej interpretacji. Inaczej mówiąc: do outsourcowania wyobraźni. Efektem były przede wszystkim wizualizacje międzygatunkowych hybryd, mutacji i osobliwych połączeń, których nadal – mimo przebrzmiałej mody – niebanalny wybór dostarcza szereg dedykowanych profili w mediach społecznościowych.

Zaznaczenie obecności sztucznej inteligencji i nawiązanie bezpośredniego kontaktu z użytkownikami domaga się szerszego omówienia – także z perspektywy praktyk artystycznych, od lat 60. XX wieku eksperymentujących i analizujących krytycznie AI. Fantazję o autonomicznie kreowanej przez maszynowe byty sztuce snuł i zrealizował między innymi Harold Cohen, którego cykl programów pod wspólną nazwą AARON w praktyce próbował odpowiedzić na pytanie badawcze artysty: „Jakie są minimalne warunki, w których zestaw znaków funkcjonuje jako obraz?”. W rezultacie aż do śmierci Cohena w 2016 roku AARON produkował obrazy – obdarzone statusem dzieła artystycznego – sprawnie przełączając się pomiędzy nurtami sztuki abstrakcyjnej i figuratywnej. Pół wieku później popularność w środowisku twórczym zdobywają bardziej złożone rozwiązania technologiczne, między innymi sieci GAN (generative adversarial network – generatywne sieci współzawodniczące; przykład sztuki wykorzystującej GAN)[1] czy program DeepDream[2].

Obecność sieci neuronowych w kulturze ujawnia się nie tylko podmiotowo (jako narzędzie i współautor), ale i przedmiotowo – jako temat podejmowany przez ludzko-technologiczne kolektywy artystów i praktyków działań na przecięciu technologii i sztuki.

Ciekawie podszedł do tego Jake Ewels w „ML Porn” – opierając się na sieci neuronowej Yahoo, wytrenowanej pierwotnie do cenzury treści pornograficznych, podjął próbę wytworzenia najbardziej przesiąkniętej seksualnością (w rozumieniu sieci neuronowych) serii obrazów. Rezultatem badań jest technoqueerowy manifest wizualny. Sieci, których wybory i sposób postrzegania rzeczywistości komentuje Ewels, postrzegają świat (a raczej jego reprezentację w postaci biblioteki danych, którymi są karmione) za pomocą korelacji, a nie ciągu przyczynowo-skutkowego. Dzięki temu swobodniej przepływają pomiędzy binarnymi (sic!) kategoriami tożsamości płciowej, których po prostu nie uznają za znaczące.

Machine Learning Porn from Jake Elwes on Vimeo.

Eksperyment Ewelsa włącza do postrzegania konwencjonalnych kategorii odświeżone spojrzenie sieci neuronowych – spojrzenie przekraczające ograniczenia obciążonej metanarracjami ludzkiej percepcji[3]. To właśnie w różnicy, która powstaje (choć lepiej – z pozagramatycznego punktu widzenia – byłoby powiedzieć: wytwarza się) pomiędzy technologicznymi i ludzkimi podmiotami, oraz w możliwości przeszczepienia perspektyw jawią się najbardziej intrygujące obietnice wariantów współ-życia z nie-ludzkimi aktorami.

Różnica między tym, co wytworzone przez człowieka, a efektem maszynowego działania stanowi także temat pracy badawczej i twórczej Robbiego Barrata. Dzięki zaprzęgnięciu do własnej praktyki artystycznej strategii twórczej „tradycyjnego malarza” Ronana Barrota Barrat odkrywa sposoby rozumienia i postrzegania przez sieci neuronowe tego, czym jest ludzka postać. Jedna z jego najsłynniejszych prac – „Korekta po Peterze Paulu Rubensie, »Saturn pożerający swojego syna«” – powstała z wykorzystaniem sposobu pracy Barrota, który nie będąc zadowolony z wybranej części stworzonego przez siebie obrazu, zamalowuje miejsce jaskrawopomarańczową farbą, by następnie pokryć je ponownie określonymi kształtami. Technikę Barrota Barrat stosuje wobec sieci neuronowych – poprzez wielokrotne zasłanianie fragmentów i wydanie polecenia rekonstrukcji zasłoniętych obszarów przez sieć obraz zostaje zrekonstruowany i „poprawiony”, to znaczy uzupełniony o wyobrażenie zasłoniętego fragmentu w rozumieniu sztucznej inteligencji. „Proszę nie interpretować tej pracy jako próby poprawy lub aktualizacji starych prac – staram się jedynie ujawnić wenętrzne wyobrażenie sieci o tym, jak wygląda nagie ciało” – przestrzega Barrat. Ujawnia tym samym, że przedmiot jego praktyki artystycznej ogranicza się w dużym stopniu do złożenia depozytu wyobraźni w nieodkrytym potencjale percepcyjnym wykorzystywanych przez niego sieci neuronowych.

“A Recent Entrance to Paradise” a work produced by Dr. Thaler’s “Creativity Machine” | Public Domain

 

Wyświetl ten post na Instagramie

 

Post udostępniony przez Robbie Barrat (@robbie.exe)

 

Czym jednak jest to osobliwe zjawisko, dysponujące własnym, fascynującym aparatem poznawczym? Czy sztuczna inteligencja, obdarzona w pewnych przypadkach mocą decyzyjną i sprawczością, jest osobą mającą własną podmiotowość (co wynikać miało chociażby z przyznania przez Arabię Saudyjską obywatelstwa androidowi)?

Czy jednak antropomorfizacja zjawiska o charakterze maszynowym jest strategią inżynierii społecznej, która ma na celu uzyskanie szeroko akceptowanego przyzwolenia na oddanie sprawczości uczącym się maszynom?

Nooskop Matteo Pasquinellego i Vladana Jolera świadczy raczej na rzecz drugiego z wyżej wymienionych scenariuszy. Twórcy wskazują, że

już w wyrażeniu „sztuczna inteligencja” przymiotnik „sztuczny” niesie ze sobą mit autonomii technologii – wskazuje na karykaturalne „obce umysły”, które samoreprodukują się w krzemie, chociaż w rzeczywistości mistyfikują dwa procesy właściwej alienacji: rosnącą geopolityczną autonomię firm hi-tech i inwigilację autonomii pracowników na całym świecie.

Pasquinelli i Joler przeprowadzają próbę „sekularyzacji” AI. Dążą do ukazania jej jako instrumentu – narzędzia ekstrawizmu wiedzy. „W tradycji nauki uczenie maszynowe jest po prostu […] instrumentem do oglądania i nawigowania w przestrzeni wiedzy (od greckiego skopein »badać, patrzeć« i noos »wiedza«)” – dodają w komentarzu do diagramu. Scjentystyczną perspektywę przeciwstawiają wszelkim próbom romantyzacji AI – jak chociażby w przypadku „AI DIY: Podręcznik Domowej Halucynacji” duetu Eternal Engine, gdzie granica pomiędzy snem sieci neuronowych a wizjami stanów pscyhodelicznych jest płynna i trudna do zdefiniowania.

W przeciwieństwie do Nooskopu „AI DIY…” legitymizuje się jednak konkretnym osiągnięciem: udanym przekroczeniem ograniczeń dojmującego realizmu oraz zrozumieniem palącej potrzeby transgresji.

Co prawda więc wyobraźnia pogrążona jest w kryzysie, ale ciąg dalszy jednak nastąpi. Albo już następuje.


Przypisy:
[1] Technologia opracowana w 2014 r. pod kierownictwem badawczym Iana Goodfellowa pozwala algorytmom – których możliwości do tej pory ograniczały się do rozpoznawania i klasyfikowania obiektów z biblioteki danych – na przekraczanie ograniczeń i wytwarzanie nowych, unikatowych treści wizualnych i dźwiękowych. To stało się możliwe dzięki wytworzeniu takiego modelu sztucznej inteligencji, w którym interakcja dwóch sieci neuronowych polega na „walce” i rekursywnej „próbie dominacji”. Pierwsza z nich staje się „generatorem” pełniącym funkcję producenta, druga zaś – „dyskryminator” – jest rodzajem klasyfikatora. Podczas gdy generator wytwarza nowe dane, które podszywają się pod wskazaną wcześniej kategorię, zadaniem dyskryminatora jest ocena, czy zaproponowane przez generatora dane można zaklasyfikować jako prawdziwe. „O modelu generatywnym można myśleć jako o analogicznym do zespołu fałszerzy próbujących wyprodukować fałszywą walutę i użyć jej bez wykrycia, podczas gdy model dyskryminacyjny jest analogiczny do policji próbującej wykryć fałszywą walutę. Rywalizacja w tej grze napędza oba zespoły do doskonalenia swoich metod aż do momentu, gdy falsyfikaty będą nie do odróżnienia od autentycznych artykułów” – stwierdza Emre Neftci.
[2] DeepDream to program wizji komputerowej stworzony przez inżyniera Google, Alexandra Mordvintseva. Wykorzystuje konwencjonalną sieć neuronową do wyszukiwania i wzmacniania wzorów w obrazach poprzez algorytmiczną pareidolię, tworząc w ten sposób senny wygląd przypominający doświadczenie psychodeliczne w celowo przeprocesowanych obrazach. Program Google’a spopularyzował termin „(głębokie) śnienie” w odniesieniu do generowania obrazów, które wytwarzają pożądane aktywacje w wyszkolonej sieci głębokiej. Aktualnie termin ten odnosi się do zbioru powiązanych podejść. Oprogramowanie DeepDream zostało zaprojektowane do wykrywania twarzy i innych wzorów na obrazach w celu automatycznego klasyfikowania obrazów. Jednak po wytrenowaniu sieć może być również uruchomiona w odwrotnym kierunku.
[3] Algorytmy nie są jednak bezstronne – zob. https://news.mit.edu/2022/machine-learning-bias-0601.