AlphaGo Zero, l’intelligenza artificiale autodidatta

Un’intelligenza artificiale (IA) è una macchina che, se anche non è davvero in grado di pensare, dimostra di saper eseguire operazioni considerate tipiche del ragionamento umano. Una capacità di fondo di questi programmi è quella di imparare, cioè migliorare le proprie prestazioni con l’esperienza. Gli esseri umani imparano in gran parte imitando, ma non è detto che una macchina debba avere i nostri limiti. AlphaGo Zero, per esempio, ha imparato a giocare all’antico gioco Go semplicemente giocando contro sé stessa, e ora può mettere nel sacco ogni campione in carne e ossa.

 

Da Deep Blue a DeepMind

A fine anni ’90 erano diventate celebri le “scazzottate” tra lo scacchista Garry Kasparov e il supercomputer dell’IBM Deep Blue. Nel 1997, per la prima volta nella storia, la macchina ebbe la meglio in un torneo contro il campione del mondo.

Ma Deep Blue, in ultima analisi, era una potentissima calcolatrice. I programmatori avevano costruito un database di 700 000 partite vinte da Gran maestri come lo stesso Kasparov, con cui la macchina confrontava ogni singola mossa. La vittoria di Deep Blue era quindi dovuta alla forza bruta, non alla creatività.

Il gioco di Go, inventato 3000 anni fa in Cina, ha regole semplici ma le possibili evoluzioni di un partita sono molto più numerose che negli scacchi. La forza bruta in questo caso non servirebbe a molto: le possibili configurazioni della scacchiera sono 10170, troppe per essere valutate alla maniera di Deep Blue. Per questo il gioco è considerato uno dei banchi di prova per lo studio delle IA, e fino a poco tempo fa i campioni umani continuavano a battere le macchine senza troppi problemi.

Poi è arrivato Google con il suo progetto di intelligenza artificiale DeepMind, da cui è nato AlphaGo, un programma in grado di apprendere il gioco di Go partita dopo partita. Nel 2015 AlphaGo è stata la prima intelligenza artificiale a sconfiggere un giocatore professionale alla pari, cioè senza uno svantaggio iniziale assegnato all’umano per livellare il campo. Poi nel 2016 a cedere le armi è stato Lee Sedol, uno dei più grandi giocatori del mondo.

La copertina di Nature del gennaio 2016, 2 mesi dopo AlphaGo avrebbe sconfitto anche Lee Sedol (Immagine: Nature)

 

Macchine che imparano

Il segreto delle intelligenze artificiali come AlphaGo sono le reti neurali artificiali, dei programmi che imitano il funzionamento del nostro cervello a base di neuroni e sinapsi. Nelle reti neurali artificiali la risposta (output) della macchina ai segnali in entrata (input) dipende da come diversi livelli di “neuroni artificiali” della rete, tra loro connessi, pesano e ritrasmettono il segnale verso i livelli gerarchici più elevati. All’inizio di un nuovo compito la rete non può avere grandi prestazioni, ma grazie al confronto con esempi apprende velocemente come adattarsi fino a ottenere i migliori risultati, un po’ come farebbe un bambino.

Schema di una semplice rete neurale artificiale (immagine: Texample.net)

AphaGo aveva imparato soprattutto giocando a Go contro sé stesso, ma la sua base per l’apprendimento era simile a quella di Deep Blue: un database con oltre 30 milioni di mosse giocate da campioni. La nuova versione AlphaGo Zero non ha invece nessun bisogno di esempi umani. Usando solo le regole di base, il programma ha cominciato a giocare contro sé stesso, diventando sempre più forte. In una ventina di giorni la macchina ha raggiunto il livello dei campioni del mondo, distruggendo 100 – 0 la versione di AlphaGo che nel 2016 aveva battuto Lee Sedol,

Questi risultati sono stati presentati il mese scorso sulla rivista Nature e sono significativi sotto diversi aspetti. Per esempio è stupefacente la rapidità con cui i ricercatori sono riusciti a ottenere questo risultato: dopo poco più di un anno dalla storica sconfitta di Lee il mondo dell’intelligenza artificiale ha un altro record infranto.

Eppure, nonostante AlphaGo Zero sia il miglior giocatore di Go del mondo, richiede molta meno potenza computazionale delle versioni precedenti: è quindi sempre più importante come “pensano” le macchine rispetto alla forza bruta. Ma soprattutto gli studiosi segnalano che il totale autoapprendimento ha fatto emergere già dopo poche ore di addestramento strategie di gioco mai viste da 3.000 anni a questa parte.

Sembra che questa volta saranno i giocatori a dover imparare dalla macchina….

 

Immagine in apertura: Immagine promozionale del documentario Alphago

Immagine box: Deepmind

Per la lezione

Prosegui la lettura

Commenti

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *