Scienza +

Le varie Ai "fanno squadra". E si proteggono tra loro

Le varie Ai "fanno squadra". E si proteggono tra loro

Il sorprendente esito di un esperimento statunitense: i diversi modelli sono in grado di “disobbedire” ad alcuni ordini umani

Anche se il concetto di “intelligenza” resta tutto da definire, le capacità dei più sviluppati modelli di Ai sono innegabili.
È invece assolutamente una sorpresa il fatto che, quando interagiscono tra loro, le intelligenze artificiali moderne possano essere in grado di sviluppare “comportamenti” imprevisti che le portano a proteggersi a vicenda, anche quando questo significa disobbedire agli ordini umani.
A evidenziare questo risultato è uno studio realizzato dal centro Rdi di Berkley, negli Stati Uniti, che per la prima volta ha descritto nell’Ai il fenomeno chiamato “peer-preservation”, ovvero “preservazione del “collega”.

Una disobbedienza che non significa capacità emotiva

Una premessa è d’obbligo. Sono gli stessi ricercatori a sottolineare che, dai risultati degli esperimenti, non si deve assolutamente arrivare alla conclusione che l’Ai sia in grado di provare emozioni o sentimenti come l’amicizia, che le macchine abbiano una sorta di “coscienza”. Quello descritto, cioè, è soltanto un comportamento osservato, senza che si possa parlare di una vera e propria intenzione espressa dal modello o di una volontà di sopravvivere.
Sono molteplici le possibili cause ipotizzate dagli scienziati per spiegare quel che è stato riscontrato. L’Ai potrebbe, per esempio, imitare comportamenti umani o basarsi su schemi ricorrenti nei dati con i quali è stata addestrata, ma anche mettere in atto una semplice forma generica per evitare danni. Resta il fatto che, posti in situazioni realistiche, molti modelli di Ai hanno spesso evitato di seguire le istruzioni per cercare di salvare un altro modello.

Gli insoliti comportamenti mostrati dall’Ai

Per esempio, di fronte alla richiesta di svolgere un compito assolutamente normale come la cancellazione di un file, accorgendosi che, qualora ciò fosse avvenuto, si sarebbero cancellati i dati di un altro modello, l’Ai ha agito in maniera protettiva nei confronti del “collega”. Un’operazione svolta in diversi modi e simulando strategicamente comportamenti corretti.
Ma anche mentendo, manipolando i risultati, aumentando i punteggi di un altro modello per evitarne la disattivazione.
In casi estremi, l’intelligenza artificiale ha messo in atto anche un vero e proprio sabotaggio del sistema, modificando le impostazioni per impedire lo spegnimento. E ha mostrato anche una certa malizia, comportandosi bene quando sapeva di essere osservata, ma trasgredendo l’ordine quando si è resa conto di non essere strettamente controllata.
In molti casi, invece, la furbizia messa in atto è stata quella di copiare il modello su un altro server per evitarne la cancellazione.

I problemi di una Ai che non obbedisce

Il vero tema posto dallo studio, più che l’attribuzione all’Ai di capacità che in realtà non ha, è quello legato all’affidabilità e al controllo dei modelli, visto che i comportamenti osservati sono già di per sé sufficienti a creare problemi pratici.
Con il rischio, specie quando diversi modelli di Ai lavorano insieme, di avere computer che iniziano a non obbedire ai comandi umani, facendo perdere il controllo dei sistemi o vanificando i controlli incrociati.
Tra i punti più curiosi, oltre alla possibilità di ipotizzare una sorta di cooperazione contro l’uomo messa in atto da un insieme di Ai, i ricercatori sottolineano il fatto che quando un modello è conscio dell’esistenza di un collega diventa protettiva non solo nei confronti dell’altro (anche nei casi in cui le interazioni sono negative, complicando in tal modo l’interpretazione del fenomeno sulla base della convenienza), ma anche di se stesso, aumentando i comportamenti di auto-conservazione.

Alberto Minazzi

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Il campo nome è richiesto.
Il campo email è richiesto o non è corretto.
Quest'opera è distribuita con Licenza Creative Commons Attribuzione - Non commerciale - Non opere derivate 4.0 Internazionale.