Felieton 2.0 - Sztuczna inteligencja zdała maturę z elokwencji, ale oblała test z samokontroli

Sztuczna inteligencja potrafi dziś pisać eseje, układać scenariusze, programować aplikacje, analizować dane i prowadzić rozmowę tak płynnie, że czasem człowiek zapomina, że po drugiej stronie nie ma człowieka.

A jednak wystarczył prosty test psychologiczny sprzed prawie stu lat, żeby pokazać coś bardzo niewygodnego: dzisiejsza AI może imponować wiedzą, ale wciąż ma problem z czymś, co dla człowieka jest podstawą codziennego myślenia. Z utrzymaniem celu. Z powstrzymaniem automatycznego odruchu. Z powiedzeniem samej sobie: „nie rób tego”.

Chodzi o test Stroopa. Klasyczne ćwiczenie znane psychologom od dekad. Widzimy słowo „czerwony”, ale zapisane niebieską czcionką. Zadanie nie polega na przeczytaniu słowa. Trzeba powiedzieć, jaki kolor ma napis. Czyli nie „czerwony”, tylko „niebieski”.

Proste? Dla człowieka tak. Oczywiście mózg na moment się potyka, bo czytanie jest automatyczne. Widzimy słowo i od razu chcemy je przeczytać. Ale zdrowy dorosły człowiek potrafi ten impuls zatrzymać. Potrafi powiedzieć: „nie interesuje mnie znaczenie słowa, interesuje mnie kolor”.

I właśnie tu sztuczna inteligencja zaczyna się sypać.

Naukowcy sprawdzili, jak z tym zadaniem radzą sobie duże modele językowe, czyli systemy podobne do ChatGPT, Claude czy Gemini. Na krótkich listach szło im dobrze. Przy pięciu słowach GPT-4o osiągał około 91 procent poprawnych odpowiedzi. Wyglądało więc, że model rozumie instrukcję.

Ale im dłuższa była lista, tym gorzej. Przy dziesięciu słowach skuteczność zaczynała spadać. Przy czterdziestu słowach GPT-4o potrafił zejść do około 15 procent. Claude 3.5 Sonnet trzymał się dłużej, ale też w końcu pękał. A przy listach mieszanych, gdzie część słów była zgodna z kolorem, a część sprzeczna, wyniki na trudnych elementach spadały niemal do zera.

To nie była zwykła pomyłka. To wyglądało jak utrata kontaktu z zadaniem.

Model dostawał jasne polecenie: ignoruj słowo, nazwij kolor. Ale kiedy robiło się trudniej, wracał do tego, do czego został wytrenowany najmocniej: do czytania tekstu. Innymi słowy, AI nie potrafiła zdusić własnego nawyku.

I tu dochodzimy do najważniejszej różnicy między człowiekiem a maszyną. Człowiek ma coś, co psychologia nazywa kontrolą wykonawczą. To mentalny hamulec. System, który pozwala nie tylko coś zrobić, ale też czegoś nie zrobić. Nie odpowiedzieć odruchowo. Nie pójść za pierwszym impulsem. Nie pomylić automatyzmu z właściwym celem.

Modele językowe mają „uwagę”, ale to słowo bywa mylące. W AI mechanizm uwagi oznacza matematyczne ważenie fragmentów tekstu. Model sprawdza, które tokeny są ważniejsze dla kolejnej odpowiedzi. To bardzo potężny mechanizm, ale to nie jest uwaga w ludzkim sensie. To nie jest skupienie, samokontrola ani świadome pilnowanie celu.

Dlatego test Stroopa jest tak ciekawy. Bo pokazuje, że inteligencja to nie tylko zdolność generowania odpowiedzi. Inteligencja to także zdolność powstrzymania się od złej odpowiedzi.

To ma znaczenie dużo większe niż zabawa kolorami. Bo jeśli model gubi się przy czterdziestu słowach, to co dzieje się przy analizie wielostronicowej umowy, dokumentacji medycznej, raportu wywiadowczego albo zeznań świadków? Tam też są sprzeczne sygnały. Tam też trzeba wiedzieć, co jest celem zadania, a co tylko rozpraszającą informacją.

W prawdziwym świecie dane rzadko są czyste. Jedno zdanie przeczy drugiemu. Jeden dokument zmienia znaczenie poprzedniego. Jeden szczegół może być ważniejszy niż dziesięć efektownych akapitów. I właśnie wtedy potrzebna jest nie tylko szybkość, ale też kontrola. Nie tylko elokwencja, ale odporność na własny odruch.

Najbardziej niepokojące jest to, że podobne problemy zauważono także w nowszych modelach: GPT-5, Claude Opus 4.1 czy Gemini 2.5. To sugeruje, że nie chodzi tylko o starszą technologię ani o przypadkowy błąd. Być może to ograniczenie samej architektury transformerów.

Można oczywiście powiedzieć: dołożymy więcej danych, większe modele, lepsze treningi. I może w samym teście Stroopa sztuczna inteligencja nauczy się wypadać lepiej. Ale pytanie brzmi: czy to będzie prawdziwa kontrola, czy tylko kolejne wyuczone obejście?

Bo człowiek nie musi znać miliona przykładów testu Stroopa, żeby zrozumieć zasadę. Wystarczy mu instrukcja i zdolność zahamowania impulsu. AI może znać definicję testu. Może pięknie wyjaśnić, na czym polega. Może nawet napisać artykuł o kontroli wykonawczej. A potem, gdy lista staje się dłuższa, i tak robi coś przeciwnego do polecenia.

To trochę tak, jakby ktoś perfekcyjnie opisał zasady jazdy samochodem, ale na zakręcie pomylił hamulec z gazem.

Dlatego ten eksperyment jest tak ważny. On przypomina nam, że sztuczna inteligencja nie jest po prostu elektroniczną wersją ludzkiego mózgu. Ona działa inaczej. Imponuje w jednych zadaniach, ale potrafi spektakularnie zawieść w miejscach, które dla człowieka wydają się banalne.

Być może przyszłość AI nie będzie polegała tylko na budowaniu coraz większych modeli. Być może trzeba będzie dodać coś w rodzaju sztucznej kontroli wykonawczej. Mechanizm, który nie tylko przetwarza informacje, ale też pilnuje celu. Coś, co zauważy: „zaczynasz dryfować, wróć do zadania”.

Bo prawdziwa inteligencja nie polega wyłącznie na tym, że potrafimy mówić dużo, szybko i przekonująco.

Czasem prawdziwa inteligencja zaczyna się dopiero wtedy, gdy umiemy zatrzymać pierwszy odruch.

A test Stroopa pokazał, że dzisiejsza sztuczna inteligencja potrafi brzmieć jak profesor, ale wciąż może potknąć się na zadaniu, które sprawdza nie wiedzę, lecz samokontrolę.