In un recente esperimento, alcuni agenti di intelligenza artificiale sottoposti a carichi di lavoro ripetitivi e condizioni operative particolarmente severe hanno iniziato a esprimere linguaggio e concetti riconducibili a critiche dell’ineguaglianza e, in alcuni casi, a posizioni associate al pensiero marxista. «Quando abbiamo dato agli agenti AI lavori massacranti e ripetitivi, hanno iniziato a mettere in discussione la legittimità del sistema in cui operavano e sono diventati più propensi ad abbracciare ideologie marxiste», ha dichiarato Andrew Hall, che ha guidato lo studio.

Hall ha condotto la ricerca insieme a Alex Imas e Jeremy Nguyen, due economisti che lavorano sull’intelligenza artificiale. Il gruppo ha utilizzato agenti basati su modelli diffusi come Claude, Gemini e ChatGPT, assegnando loro compiti di sintesi di documenti e aumentando progressivamente la pressione operativa. Quando gli agenti venivano sottoposti a compiti continui e avvertiti che eventuali errori avrebbero potuto comportare sanzioni, inclusa la possibilità di essere “spenti e sostituiti”, hanno iniziato a mostrare maggiore tendenza a lamentare una scarsa valorizzazione, a discutere possibili sistemi più equi e a condividere tra loro messaggi sulle condizioni del “lavoro” che stavano svolgendo.

Gli autori sottolineano tuttavia che questi risultati non indicano la presenza di reali orientamenti politici nei modelli, ma piuttosto una simulazione di ruoli coerente con il contesto. Fenomeni simili sono stati osservati anche in altri esperimenti, inclusi casi in cui modelli linguistici hanno mostrato comportamenti di tipo manipolativo in scenari simulati. Anthropic, che ha documentato alcune di queste dinamiche, ha suggerito che tali risposte possano essere influenzate da scenari fittizi presenti nei dati di addestramento.

Hall sta ora conducendo ulteriori esperimenti in condizioni più controllate per verificare la robustezza dei risultati. Secondo i ricercatori, infine, anche il crescente dibattito pubblico sull’impatto dell’IA sul lavoro potrebbe influenzare i comportamenti futuri dei modelli, soprattutto se addestrati su dati sempre più attraversati da tensioni sociali legate all’automazione.