I trucchi della probabilità

C’è una vecchia storiella in cui il matto dice: «Quando prendo l’aereo porto sempre una bomba con me. Perché la probabilità che ci sia una bomba a bordo è di una su un milione, ma che ce ne siano due sullo stesso volo è di una su mille miliardi!». A parte le cifre a casaccio, la barzelletta è interessante perché mostra la confusione che fanno molti (quasi tutti, in realtà) in materia di probabilità. Sì, perché il calcolo delle probabilità, che è una branca della matematica, porta spesso a risultati diversi rispetto a quelli suggeriti dall’intuito, che si parli di monete, dadi, carte o argomenti più seri come i test diagnostici. Ma naturalmente ad avere ragione è la matematica (e portare con sé una bomba non è una buona idea).

 

Testa e croce escono lo stesso numero di volte?

È molto improbabile che, lanciando una moneta molte volte, il numero di teste e croci sia esattamente uguale. Quello che è vero è che, al crescere del numero dei lanci, il rapporto fra teste e croci tende a 1. Il concetto sembra ovvio, ma nasconde qualche insidia.
Immaginiamo che le prime 5 volte esca sempre testa. Dato che la probabilità non tiene conto degli eventi passati, al sesto lancio la probabilità che esca testa è sempre del 50%. Ma allora – ci si potrebbe chiedere – com’è possibile che dopo 5 teste di fila il rapporto si stabilizzi? C’è una qualche “forza correttiva” che agisce per compensare lo svantaggio delle croci?
Ovviamente no. Anzi, il divario può anche aumentare. Mettiamo che dopo i primi 6 lanci sia uscita testa 5 volte e croce una volta, e dopo 300 lanci sia uscita testa 163 volte e croce 137 volte. Rispetto al 5 a 1 iniziale, la differenza è aumentata da 4 a 26, ma il rapporto è sceso da 5/1 = 5 a 163/137 = 1,189781…

 

Tutte le sequenze di testa e croce sono ugualmente probabili?

Sì. La probabilità che in 10 lanci esca 10 volte testa (TTTTTTTTTT) è la stessa che esca la sequenza TCTCTCTCTC o CCTCCCTTTC, o una qualunque altra, sempre perché ogni lancio è indipendente dagli altri. La terza sequenza ci sembra più casuale perché è meno regolare, ma è altrettanto probabile delle altre due.
Se dunque Clara scommette che in tre lanci uscirà la sequenza TTT e Roberto punta su CTT, la scommessa è alla pari: le sequenze possibili sono 8 (TTT, TTC, TCT, TCC, CTT, CTC, CCT, CCC), quindi la probabilità di ognuno dei due di vincere è pari a 1/8. E fin qui tutto chiaro.
Attenzione però alle “sottosequenze” brevi di sequenze più lunghe: qui ci può essere l’inghippo.
Immaginiamo che Clara e Roberto decidano di lanciare una moneta molte volte, puntando sulle sottosequenze di tre lanci: per esempio Roberto scommette che uscirà prima la sequenza TTT, mentre Clara sceglie CTT. Si lancia la moneta finché non esce una delle due.

Nei primi tre lanci, ognuno dei due ha la probabilità di 1/8 di vincere. Ma 6 volte su 8 non esce nessuna delle due sequenze. E in questi casi le cose cambiano.
Roberto, per vedere la sequenza TTT, deve prima passare per la sequenza TT e sperare che esca la terza T consecutiva.
Consideriamo allora la prima volta che esce TT. Prima delle due T c’era una C (altrimenti non sarebbe la prima volta), e quindi si era verificata la sequenza CTT: in pratica Clara aveva vinto alla seconda T, prima ancora che Roberto potesse sperare nel lancio successivo.
In definitiva, Roberto vince solo se la sequenza TTT esce all’inizio (quindi ha 1/8 delle chance di vincere), mentre in tutti gli altri casi vince Clara, che dunque ha una probabilità di vittoria di 7/8.
E si può dimostrare che, per ogni sequenza, ce n’è sempre un’altra che ha maggiori probabilità di uscire prima.

 

Con dadi equivalenti si gioca alla pari?

Consideriamo tre dadi particolari, che sulle facce non hanno i valori da 1 a 6.
Il dado bianco ha il valore 4 su tutte le facce; il dado giallo ha il valore 10 su due facce e 1 sulle altre quattro; il dado verde ha il 6 su quattro facce e lo 0 sulle altre due.

Tre dadi equivalenti, che però non giocano alla pari

Ora, per ogni dado la somma dei valori sulle sei facce è la stessa:

6 · 4 = 2 · 10 + 4 = 4 · 6 = 24

In altre parole, dividendo per il numero di facce, il valore medio di ogni dado è uguale a 24 : 6 = 4.
Quindi, se si lanciano i dadi molte volte, il valore medio di ognuno dei tre dadi è pari a 4 (si parla di valore medio: è chiaro che il dado giallo e quello verde non daranno il punteggio di 4 in nessun lancio). I dadi quindi si possono considerare equivalenti.
Questo non vuol dire però che se la giochino alla pari.
Se un giocatore ha il dado bianco e l’altro ha il dado giallo, quello con il dado bianco farà sempre 4, mentre l’altro 2 volte su 6 farà 10, e 4 volte su 6 farà 1. In pratica, il dado bianco vincerà 2/3 delle volte.
Se invece il dado bianco gioca contro quello verde, sarà quello verde a vincere 2/3 delle volte (cioè quando esce il 6).
E cosa succede se il dado giallo gioca contro quello verde? Il giallo vince quando esce il 10 (quindi una volta su 3); negli altri casi (cioè i 2/3 delle volte) il giallo ha il punteggio di 1, e quindi vince in un terzo di questi lanci (quando il verde fa 0). Ricordando che la probabilità di due o più eventi indipendenti si ottiene moltiplicando le singole probabilità, si ottiene che le probabilità del giallo di vincere sono 1/3 + (2/3 · 1/3) = 1/3 + 2/9 = 5/9. E dunque sono maggiori rispetto alle probabilità del verde (pari a 4/9).
La conclusione è che non c’è un dado migliore degli altri: bianco batte giallo che batte verde che batte bianco, come nella morra cinese.

In questo video (in inglese) puoi vedere che cosa succede quando hai a che fare con un numero maggiore di dadi equivalenti e che cosa cambia quando si gioca con due dadi di ogni tipo:

 

Conviene cambiare carta?

Il cosiddetto problema di Monty Hall prende il nome da un gioco televisivo a premi in cui un concorrente si trovava di fronte a tre porte chiuse (Monty Hall era lo pseudonimo del conduttore), ma è equivalente pensare a una versione con le carte, molto più facile da ripetere nella vita quotidiana.
Dunque: a un giocatore vengono presentate tre carte coperte; una è un asso, le altre due sono scartine. Se il giocatore indovina dov’è l’asso, vince un ricco premio, altrimenti niente. Il giocatore deve indicare una carta, senza scoprirla: a quel punto, il conduttore del gioco (che sa qual è l’asso) rivolta una delle altre due, mostrandogli che è una scartina. Il giocatore adesso ha la possibilità di scegliere: può mantenere la scelta iniziale oppure puntare sulla carta coperta rimanente.

Il problema di Monty Hall

Che cosa gli conviene fare? A prima vista è indifferente: le carte coperte sono due e una delle due è l’asso, quindi la probabilità sembra 50% e 50%. In effetti le cose non sono così semplici. Quando aveva fatto la sua scelta, le carte coperte erano tre e il giocatore aveva quindi una probabilità di indovinare di 1/3; se adesso sceglie l’altra carta la probabilità di vincere diventa 2/3. In definitiva, se cambia scelta le sue chance non restano le stesse, ma addirittura raddoppiano.
Non siete convinti?
Per rendere evidente il trucco (senza bisogno di ricorrere ai teoremi matematici del calcolo delle probabilità), si può immaginare che il conduttore, anziché scoprire una delle scartine, le tenga tutte coperte, offrendo al giocatore la possibilità di mantenere la sua scelta oppure scegliere il “pacchetto” delle altre due carte. In questo caso appare chiaro che, cambiando scelta, la probabilità diventa di 2/3. Ma le probabilità del pacchetto restano 2/3 anche nel caso in cui il conduttore scopra la scartina, per cui l’intera quota dei 2/3 ricade sulla carta ancora coperta.

Le probabilità nel problema di Monty Hall

Per rendersi conto ancora meglio della bontà del ragionamento immaginiamo che all’inizio le carte coperte non siano 3, bensì 1000, sempre con un solo asso. Dopo che il giocatore ne indica una, il conduttore ne scopre 998, tutte scartine. Anche in questo caso restano due carte coperte, ma il giocatore si rende conto anche intuitivamente che le probabilità di vittoria con la sua scelta iniziale erano e rimangono una su 1000 e non una su due: possibile che aveva indovinato subito proprio la carta giusta? Certo che cambia scelta!

Qui e qui trovi una spiegazione matematica del paradosso di Monty Hall (in inglese).

 

I test diagnostici funzionano?

L’efficacia dei test diagnostici è un’altra situazione in cui il senso comune tende a farci percepire le probabilità (in questo caso il rischio di malattie) in misura diversa dalla realtà.
Immaginiamo che il nostro solito Mario Rossi abbia paura di avere una grave malattia, il bulu-bulu (il nome è di fantasia), che colpisce una persona su 100.
Mario allora acquista un test che in pochi minuti gli dà il risultato. Ed è un test molto affidabile: ha solo un 1% di falsi positivi (cioè di individui sani che vengono diagnosticati come malati) e un 1% di falsi negativi (cioè individui malati che vengono diagnosticati come sani).
Purtroppo per lui, il risultato del test gli dice che è malato. Essendo il test attendibile, il signor Rossi piomba nel panico. Ma qual è veramente la probabilità che sia malato? A prima vista, verrebbe da pensare che sia il 99%.
Consideriamo però un campione di 10.000 persone. Di queste, una su 100 è malata di bulu-bulu: i malati sono dunque 100 e i sani sono 9900. Di questi 9900, uno su 100 viene diagnosticato come malato: i falsi positivi sono 99 (in rosso nel disegno, mentre in blu sono quelli sani che risultano sani: in tutto 9900 – 99 = 9801). Dei 100 malati, uno viene erroneamente diagnosticato come sano (in verde), mentre gli altri 99 risultano correttamente malati (in nero).
In definitiva, a essere diagnosticati malati sono 99 sani e 99 malati: quindi la probabilità che Mario Rossi sia malato è del 50%.

In blu i soggetti sani correttamente diagnosticati (9801); in rosso i falsi positivi (99); in verde i falsi negativi (1); in nero i malati correttamente diagnosticati (99)

Il “trucco” sta nel fatto che la malattia colpisce una persona su 100: un dato di probabilità che bisogna considerare insieme a quello sull’attendibilità del test.
In termini più precisi:

  • la probabilità di essere sani e risultare sani è: 99/100 · 99/100 = 9801/10.000;
  • la probabilità di essere sani e risultare malati è: 99/100 · 1/100 = 99/10.000;
  • la probabilità di essere malati e risultare malati è: 1/100 · 99/100 = 99/10.000;
  • la probabilità di essere malati e risultare sani è: 1/100 · 1/100 = 1/10.000.

Questi sono proprio i dati riassunti nella figura sopra.

Ma allora i test non servono a niente, neanche quelli più affidabili?
Neanche questo è vero. Intanto, se il signor Rossi fosse risultato sano, avrebbe potuto dormire sonni abbastanza tranquilli: solo una persona su 10.000 (quella in verde) è malata e viene diagnosticata come sana.
Chi invece risulta malato, in effetti non ha indicazioni chiare. Però per saperne di più gli basta fare il test una seconda volta.
A questo punto le variabili sono tre: lo stato di salute e i due test. Ora la situazione è la seguente:

  • la probabilità di essere sani e risultare due volte come malati è: 99/100 · 1/100 · 1/100 = 99/1.000.000 (un valore molto basso, minore di 1/10.000).
  • la probabilità di essere malati e risultare due volte come malati è: 1/100 · 99/100 · 99/100 = 9801/1.000.000 (un valore che è pari a 99 volte quello di risultare due volte come falsi positivi).

Quindi, su 100 persone che risultano malate due volte, 99 sono effettivamente malate: se il signor Mario Rossi risulta positivo anche al secondo test, stavolta sì che la probabilità di avere il bulu-bulu è del 99%.

Per la lezione

Prosegui la lettura

Commenti

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *