lunedì 28 maggio 2018

Teorema di Bayes


Teorema di Bayes
 
Teoria della probabilità



Negli ultimi tempi, dando ripetizioni a studenti delle scuole superiori, mi sono imbattuto più volte nel teorema di Bayes. Il teorema viene trattato in Probabilità e permette di calcolare una sorta di probabilità condizionata inversa. Un esempio può spiegare meglio.

Ci sono due urne, U1 e U2. La prima contiene 50 palline bianche e 30 nere, la seconda 1 pallina bianca e 3 nere. Estraiamo una carta da un mazzo di 40 carte per scegliere l'urna: se esce una figura scegliamo U1, altrimenti U2. Poi estraiamo una pallina. Esce una pallina bianca. Ci chiediamo con quale probabilità la pallina provenga dalla U1.

Troviamo prima la probabilità P(U1) che venga scelta l’urna U1. Questa probabilità corrisponde a quella di pescare una figura da un mazzo di 40 carte, ed è P(U1) = 3/10. Infatti, le figure in un mazzo di 40 carte sono 12 perciò i casi favorevoli su quelli possibili sono 12 su 40, frazione che dà 3/10. La probabilità che venga scelta la U2 è P(U2) = 7/10. Questa si può ottenere dalla frazione casi favorevoli (28) su casi possibili (40), che dà 7/10 oppure dalla probabilità dell’evento contrario:

P(U2) = P(not-U1), che è 1-P(U1), 1-3/10, 3/10.

Calcoliamo ora la probabilità di estrazione di una pallina bianca o nera, condizionata dalla scelta dell’urna.

La probabilità che la pallina estratta sia bianca, sapendo che essa proviene dall’urna U1, è data dal numero di palline bianche di U1 diviso per il numero totale di palline di U1, e si indica con P(B|U1). Nel nostro esempio, questa probabilità è 50/80, cioè P(B|U1) = 5/8. La probabilità dell’evento complementare a questo è P(N|U1) = 3/8.

Analogamente, la probabilità di estrarre una pallina bianca dopo aver scelto l’urna U2 è P(B|U2) = 1/4, mentre la probabilità dell’evento complementare è P(N|U2) = 1-1/4, 3/4.

Qui conviene rappresentare i dati in una tabella come quella seguente, costituita da una tabella 2x2 centrale e di caselle supplementari che la circondano, 2 per lato, più altre due disposte su due lati a distanza maggiore.

In ogni casella è indicata la probabilità come si scrive nelle formule e la probabilità come valore dato o calcolato.


La tabella si presenta con i dati iniziali in grassetto
 e i primi calcolati in normale.



Le caselle centrali contengono le probabilità dell’intersezione di eventi.

P(U1&B) è la probabilità risultante che venga scelta l’urna U1 e venga estratta una pallina bianca.

Questa probabilità è data dalla formula

P(U1&B) = P(U1)*P(B|U1);

La probabilità che in una estrazione sia scelta l’urna U1 e venga estratta una pallina bianca è data dalla probabilità che venga scelta l’urna U1 per la probabilità condizionata che venga estratta una pallina bianca sapendo che essa proviene dall’urna U1.

In modo analogo si possono calcolare tutte le altre probabilità:

P(U1&N) = P(U1)*P(N|U1);

P(U2&B) = P(U2)*P(B|U2);

P(U2&N) = P(U2)*P(N|U2).

Si può notare che sommando tutti i valori delle probabilità della tabella centrale, si trova 1 (certezza).

Le caselle adiacenti ai lati contengono le probabilità condizionate. Per il momento, conosciamo i valori delle probabilità condizionate dalla scelta dell’urna, che si trovano ai lati sinistro e destro della tabella centrale.

Per trovare i valori delle probabilità condizionate, che chiamo inverse, cioè quelle che si trovano nelle caselle adiacenti ai lati sopra e sotto, si deve applicare il teorema di Bayes.

La probabilità che pescata una pallina bianca, essa provenga dall’urna U1, si indica con P(B|U1).

Per il teorema di Bayes,

P(U1|B) = P(U1)*P(B|U1) / P(B).

Osserva che il numeratore della frazione è quella probabilità dell’intersezione di cui si parlava prima.

P(U1)*P(B|U1) = P(U1&B).

Questo permette di calcolare più velocemente le probabilità condizionate che ci servono.

P(U1|B) = P(U1&B) / P(B).

Manca la probabilità totale P(B) e questa si calcola sommando le probabilità delle intersezioni nella riga corrispondente:

P(B) = P(U1&B) + P(U2&B).

Analogamente,

P(N) = P(U1&N) + P(U2&N).

Dopo questo calcolo, si può completare la tabella e dare la risposta alla domanda del problema.



La tabella completa con tutti i dati calcolati.
In rosso la risposta al quesito del problema

La probabilità che la pallina bianca estratta provenga dall’urna U1 è P(U1|B) = 15/29, 0,52 circa (52%).
La somma delle probabilità delle caselle evidenziate con lo stesso colore deve risultare 1.