Salta al contenuto

Scavare nel regno del test delle ipotesi con Python

Studio di Scienza dei Dati: Continuazione dello studio di Joel Grus "Data Science from Scratch". Questo post esplora una semplice situazione di lancio di una moneta. L'obiettivo è colmare le lacune tra i principi fondamentali, come il Teorema del Limite Centrale, il testing delle ipotesi e...

Investigare il Test dell'Ipotesi attraverso l'Uso del Codice Python
Investigare il Test dell'Ipotesi attraverso l'Uso del Codice Python

Scavare nel regno del test delle ipotesi con Python

Nel mondo affascinante della scienza dei dati, spesso ci troviamo a interrogare l'equità di un lancio di moneta. Esploriamo un esempio intrigante che illustra il concetto di significatività statistica.

Nel nostro esperimento, lanciamo una moneta 1.000 volte. Ogni lancio di moneta è un trial di Bernoulli, un'esperimento con due risultati - successo (probabilità p) e fallimento (probabilità 1-p). Sommando questi trial di Bernoulli indipendenti, otteniamo una variabile casuale binomiale (n,p).

L'ipotesi nulla in questo esempio di lancio di moneta è che la probabilità di ottenere Testata sia pari a 0,5 (50%). L'ipotesi "alt", invece, è che la probabilità di ottenere Testata non sia pari a 0,5.

Per un "test" con una significatività del 95%, se su 1.000 lanci di moneta la moneta cade su Testata tra 469 e 531 volte, si presume che la moneta sia equa. Tuttavia, se la moneta è effettivamente viziata (ad esempio, con una probabilità del 55% di ottenere Testata), la distribuzione si sposterà a destra e la probabilità di commettere un errore di tipo 2 (non respingere l'ipotesi nulla) è approssimativamente del 11,3%.

Per aumentare la potenza per rilevare un errore di tipo 2, i limiti superiori del test possono essere spostati, riducendo la probabilità di un errore di tipo 2. Ad esempio, per un test unilaterale, i limiti superiori possono essere spostati da 531 a 526, riducendo la probabilità di un errore di tipo 2 dal 11,3% al 6,3%.

Il valore p rappresenta un altro modo per decidere se accettare o respingere l'ipotesi nulla. Ad esempio, il valore p di 530 è approssimativamente del 6,2%, che è superiore alla significatività del 5%, quindi non respingiamo la nulla.

Gli intervalli di confidenza, tuttavia, forniscono una gamma all'interno della quale possiamo essere certi che il valore vero si trovi. L'intervallo di confidenza per un lancio di moneta che cade su Testata 530 volte è (0,4991, 0,5609). Poiché questo intervallo contiene 0,5 (probabilità di Testata 50% delle volte), non respingiamo la nulla.

Interessantemente, se il valore estremo fosse 540, saremmo al 95% certi che la media di questa distribuzione è contenuta tra 0,5091 e 0,5709, e questo non contiene 0,5, quindi respingiamo l'ipotesi nulla che questa sia una moneta equa.

Il Teorema del Limite Centrale gioca un ruolo cruciale in questo esperimento. Esso afferma che man mano che n (numero di trial di Bernoulli indipendenti) diventa grande, la distribuzione binomiale si avvicina a una distribuzione normale. Ripetendo questo processo più volte (N) e tracciando un istogramma della distribuzione di tutte le variabili casuali binomiale approssima la distribuzione standard normale.

In conclusione, comprendere la significatività statistica e gli intervalli di confidenza è fondamentale per determinare l'equità di un lancio di moneta. Il libro "Data Science from Scratch" di Joel Grus è una risorsa eccezionale per coloro che sono interessati ad approfondire questi concetti.

Leggi anche:

Più recente