Jakub Katarzyński, Robię człowieka
- Autor Jakub Katarzyński
- Promotor dr Mariusz Front
Katedra Zjawisk Sztuki Intermediów
Pracownia Interakcji Medialnych - Stopień Dyplom licencjacki, 2025
Założeniem pracy artystycznej było stworzenie programu, z którym bezpośrednio bez używania interfejsu bylibyśmy w stanie się komunikować. Założenie pracy zakładało również, że możliwe będzie zrealizowanie jej na zasadzie „plug’n’play”, bez potrzeby wiedzy specjalistycznej, co jednak w procesie aktu twórczego okazało się niemożliwe i wymagana była chociażby podstawowa znajomość języka programowania. Naszym hubem będzie program TouchDesigner. Tutaj okazało się, że do zaimplikowania modułu sztucznej inteligencji będącego sercem projektu, za pośrednictwem API (Application Programming Interface) potrzebne będzie stworzenie połączenia komunikacji programu TouchDesigner z jednostką ChatGPT w języku Python, a konkretnie poprzez API z LLM (Large Language Models) w tym przypadku firmy OpenAI oraz ElevenLabs.
Na tym polu TD świetnie odnajduje się w języku programowania Python, przy użyciu zewnętrznych jego bibliotek (External Python Library). Zatem należało poprzez wiersz poleceń zainstalować biblioteki Pythona, które będą potem służyć za węzeł komunikacyjny. Dla amatora przyjacielem okazał się ChatGPT, służący pomocną radą w debugowaniu błędów podczas tworzenia środowiska, co może nie tyle usprawniło, co umożliwiło prawidłowe działanie systemu. „If even God give me a source code” niegdyś sitem nanoszone na T-shirty hasła propagowały Wydział bodajże Informatyki krakowskiej Akademii Górniczo Hutniczej, po których to znoszeniu przyszło nam w odpowiedzi na zapytanie dostawać gotowe kody.
I tak do wytworzenia agenta za serce, a za sprawą API połączyliśmy się z Wstępnie przeszkolonym transformatorem generatywnym (Generative pre-trained transformer – GPT), czyli specjalistycznym dużym modelem językowym, w zadowalający sposób symulującym zachowanie człowieka. Kiedy się go jeszcze poinstruuje czymś w rodzaju skryptu, można uzyskać bardzo wciągające rezultaty. Naszego aktora oparliśmy na modelu GPT-4 Turbo. Jest to wysoce zaawansowany model, który rozumie polecenia zawarte w textDAT zapisane nawet w formie scenariusza. Można uczulić go na konkretne zachowania bądź kwestie w zależności od kontekstu. Nasz aktor reprezentuje superego rozmówcy, jest wariacją o formie Nadczłowieka, wewnętrznym głosem szukającym Prawdy.




