Aula di Scienze

Aula di Scienze

Persone, storie e dati per capire il mondo

Speciali di Scienze
Materie
Biologia
Chimica
Fisica
Matematica
Scienze della Terra
Tecnologia
I blog
Sezioni
Come te lo spiego
Science News
Podcast
Interviste
Video
Animazioni
L'esperto di matematica
L'esperto di fisica
L'esperto di chimica
Chi siamo
Cerca
L'esperto di matematica

Metodo sperimentale e distribuzioni statistiche

leggi

Ricevo da Valeria la seguente domanda:

Egregio professore, agli esami di Introduzione al Metodo Sperimentale sono stati assegnati i seguenti problemi:

Problema 1
In un campione di popolazione costituito da 2000 individui ogni anno avvengono 15 concepimenti nei quali il feto è affetto da trisomia. Sapendo che in questo caso solitamente solo una gravidanza su quattro si conclude con la nascita e la sopravvivenza del neonato,
a)  tracciare il grafico della distribuzione di probabilità di avere \(k\) neonati affetti da trisomia \((0\leq k \leq 15)\) con 15 concepimenti;
b)  calcolare il valore medio di neonati affetti da trisomia e la varianza;
c)  nel caso considerato è possibile utilizzare l’approssimazione normale (Gaussiana) della distribuzione?
 
Problema 2
In un individuo sano il valore di pressione arteriosa sistolica è compreso tra 96 mmHg e 144 mmHg, la pressione diastolica è invece compresa tra 60 mmHg e 90 mmHg. Considerato un campione di 60 individui sani stimare qual è il numero di individui con pressione sistolica maggiore di 136 mmHg e pressione diastolica maggiore di 80 mmHg.
(Si considerino i valori di entrambi i tipi di pressione arteriosa distribuiti normalmente e che le probabilità siano indipendenti)
Credo si tratti di Statistica, potrebbe aiutarmi nella risoluzione?
 
Le rispondo così:
 
Cara Valeria,
sì, si tratta di statistica inferenziale, in particolari di distribuzioni di variabili aleatorie discrete. Nel primo problema, se interpreto bene la consegna, si tratta di una distribuzione binomiale: infatti, si possono pensare i 15 concepimenti con trisomia come \(n=15\) esperimenti identici ripetuti, in ciascuno dei quali si ha probabilità \(p=1/4\) che si verifichi l’evento che interessa (nascita), e probabilità \(1-p)=3/4\) che non si verifichi. Pertanto, detto \(k\) il numero di possibili nascite su 15 concepimenti, con \(0\leq k \leq 5\), si ha la seguente funzione di distribuzione per la probabilità \(P(k)\):
\[P\left( k \right)=\left( _{k}^{n} \right){{p}^{k}}{{\left( 1-p \right)}^{n-k}}=\frac{15!}{k!\left( 15-k \right)!}{{\left( \frac{1}{4} \right)}^{k}}{{\left( \frac{3}{4} \right)}^{15-k}},\quad 0\le k\le 15\quad .\]
Il valore medio \(m\) e la varianza \({{\sigma }^{2}}\) si ottengono in modo particolarmente semplice nel caso di una distribuzione binomiale:
                              \[m=\sum\limits_{k=0}^{15}{P(k)\cdot k=}15\cdot p=15\cdot \frac{1}{4}=3,75\]
\[{{\sigma }^{2}}=\sum\limits_{k=0}^{15}{P(k)\cdot {{\left( m-k \right)}^{2}}=}15\cdot p\cdot \left( 1-p \right)=15\cdot \frac{1}{4}\cdot \frac{3}{4}=2,8125\quad .\]
Usualmente, una distribuzione binomiale si considera ben approssimabile con una opportuna distribuzione normale se i valori \(n\cdot p\) e \(n\cdot (1-p)\) sono entrambi maggiori di 5, cosa che in questo caso non si verifica.
Nel secondo problema, interpretando gli estremi degli intervalli come valori corrispondenti a \(m\pm 3\sigma\), abbiamo:
\[{{m}_{1}}=\frac{96+144}{2}=120\quad {{\sigma }_{1}}=\frac{120-96}{3}=8\Rightarrow {{P}_{1}}(x)=\frac{1}{8\sqrt{2\pi }}{{e}^{-\frac{{{\left( x-120 \right)}^{2}}}{128}}}\]
\[{{m}_{2}}=\frac{60+90}{2}=75\quad {{\sigma }_{2}}=\frac{75-60}{3}=5\Rightarrow {{P}_{2}}(x)=\frac{1}{5\sqrt{2\pi }}{{e}^{-\frac{{{\left( x-75 \right)}^{2}}}{50}}}\]
Ora, sappiamo che  in una distribuzione normale, la probabilità che un dato cada oltre \(m+\sigma\) è del \(15,87\%\), che cada oltre \(m+2\sigma\) è del \(2,3\%\), pertanto, dal momento che \(136=m_1+2\sigma_1\) e \(80=m_2+\sigma_2\), si può dire che la probabilità che una persona, nel campione, abbia sia la pressione sistolica maggiore di 136 che quella distolica maggiore di 80 è pari a
                                                                 \[15,87\%\cdot 2,3\%=0,36\%\]
per cui si può stimare che, su 60 individui, solo \(60\cdot 0,0036\approx 0,22\) abbiano i valori di pressione indicati, cioè probabilmente nessuno dei 60 nel campione. Se invece si volevano stime di quanti individui avessero, da una parte, pressione sistolica maggiore di 136, e quanti invece, dall’altra, avessero una pressione diastolica maggiore di 80, si avrebbero stime di \(60\cdot 0,023\approx 1,38\) e di \(60\cdot 0,1587\approx 9,52\) individui rispettivamente.
 
Massimo Bergamini

Devi completare il CAPTCHA per poter pubblicare il tuo commento