6.2 C
Rome
lunedì 29 Novembre 2021
AgoràParadossi della statistica: scimmie, Shakespeare, piscine e Nicholas Cage

Paradossi della statistica: scimmie, Shakespeare, piscine e Nicholas Cage

La pandemia ha avuto, tra i vari effetti collaterali, quello di far interessare le persone ai numeri. Ma con essi si comincia anche ad entrare nei paradossi della statistica…

Paradossi della statistica: la scimmia e Shakespeare

Percentuali, indici di contagio, probabilità, mortalità, letalità, sono tutti termini entrati nel lessico comune. Ormai anche chi ha poca dimestichezza con i numeri si cimenta con discussioni che riguardano la funzione di densità, l’intervallo di confidenza o la significatività del campione.

La statistica è la scienza che ha per oggetto lo studio dei fenomeni collettivi suscettibili di misura e di descrizione quantitativa: basandosi sulla raccolta di un grande numero di dati inerenti ai fenomeni in esame, e partendo da ipotesi più o meno direttamente suggerite dall’esperienza o da analogie con altri fenomeni già noti, mediante l’applicazione di metodi matematici fondati sul calcolo delle probabilità, si perviene alla formulazione di leggi di media che governano tali fenomeni, dette leggi statistiche.

La statistica – la parola deriva da Stato – come attività amministrativa indispensabile alla vita delle comunità risale a tempi remotissimi, dal momento che già nell’antica Grecia e nell’antica Roma troviamo tracce di documenti quali censimenti e quantità e tipologia dei beni posseduti dai cittadini.

Grazie alla tecnologia, oggi, è possibile gestire un’incredibile quantità di dati e informazioni: e questo, se da un lato ha permesso di comprendere aspetti e sfumature di fatti complessi, dall’altro ha reso la disciplina quasi dogmatica.

Le discussioni di rado vertono sul significato: una media, una correlazione, un indice di dipendenza non verranno mai messi in discussione. Si criticherà la scelta del campione o il rapporto di causa-effetto tra due o più variabili, ma nessuno contesterà la definizione e le implicazioni dei vari indicatori.

Tuttavia vi sono diversi paradossi, alcuni anche molto divertenti, che nascono dalla cieca applicazione delle metodologie statistiche. Vediamone un paio.

Paradossi della statistica: scimmie, Shakespeare, piscine e Nicholas Cage

Maledette scimmie!

Il primo paradosso riguarda la probabilità, che nei manuali di statistica viene definita come la condizione di un fatto o di un evento che si ritiene possa accadere, o che, fra più fatti ed eventi possibili, appare come quello che più ragionevolmente ci si può attendere.

Di solito la probabilità viene misurata in percentuale: un evento con probabilità zero non si verifica; un evento con probabilità 100 è praticamente certo.

Partendo da alcuni semplici assiomi, Émile Borel congetturò quanto segue: se diamo a una scimmia instancabile una macchina da scrivere, questa, in un tempo infinito, riuscirà a realizzare l’opera di Shakespeare. Si tratta ovviamente di un’affermazione facilmente contestabile nella pratica, ma se la analizziamo dal punto di vista teorico, non fa una grinza.

La probabilità che la scimmia batta la sequenza corretta dei tasti è prossima allo zero ed è frutto del caso, ma esiste e può essere misurata servendosi del calcolo combinatorio. Se tendiamo all’infinito – ovvero se il numero dei tentativi cresce sempre di più – tale probabilità aumenta fino a diventare 100!

Per tentare di verificare questa teoria, nel 2003, presso lo zoo inglese di Paignton, vennero posti nella gabbia di 6 macachi, per qualche mese, un computer e una tastiera. Il risultato dell’esperimento non fu però all’altezza delle aspettative: una lunghissima sequenza di s e la tastiera sfasciata, forse in un impeto di rabbia dovuto alla crisi da pagina bianca…

Paradossi della statistica: scimmie, Shakespeare, piscine e Nicholas Cage

Correlazione e causalità

Il secondo paradosso riguarda la correlazione tra due o più fenomeni, ovvero il legame che può esistere tra essi. Come detto all’inizio, se il coefficiente di correlazione è significativo, potranno esservi dubbi su quale sia la causa e quale l’effetto, ma si darà per scontato che tra le variabili esiste un legame di qualche tipo.

Di solito si prendono in considerazione grandezze che hanno tra loro un nesso coerente e logico – peso e altezza, reddito e consumi, numero di positivi al covid e decessi – ma cosa succede se applichiamo in modo ottuso e acritico il calcolo della correlazione? Succede che il numero di film in cui compare Nicholas Cage è correlato al numero di annegamenti in piscina. O la percentuale di divorzi nel Maine è correlata al consumo pro-capite di margarina. O altre interessanti e assurde interdipendenze.

Siamo nella zona del crepuscolo, per citare il titolo originale dello show televisivo Ai confini della realtà, questo è palese, tuttavia, prima di prendere per buono un dato statistico, riflettiamo bene.

Cartoline da Salò: un anno marchiato dalle stimmate della pandemia

 

Leggi anche

 

 

 


Massimiliano Scarna
Ha scritto di cinema e informatica su svariate riviste nazionali (Horrormania, IdeaWeb…), insegna diritto ed economia nelle scuole superiori. Ha pubblicato tre antologie di racconti – Istanti d’istanti, Extra e Ultrabizzarro– più una manciata di storie su riviste, e siti web. Ama i libri, la musica metal e il cinema.

Ti potrebbe anche interessare

1 COMMENT

Comments are closed.

Ultimi articoli