Nella statistica esistono diversi tipi di bias ed evitare e comprendere questi bias statistici può aiutarti a interpretare meglio i dati. Di seguito vengono riportati alcuni tipi diversi di bias statistici in cui è possibile imbattersi.
Il bias di conferma
Il bias di conferma è un errore per cui si consente a una nozione preconcetta di influire sul modo in cui si assegna la priorità o si interpretano le informazioni. Un esempio di bias di conferma potrebbe verificarsi quando hai un’opinione netta in merito al fatto che la maggior parte delle persone preferisce il gelato alla vaniglia rispetto al gelato al cioccolato e, di conseguenza, dai più peso ai dati che supportano tale conclusione.
Bias di selezione
Il bias di selezione è un errore che deriva dall’utilizzo di campioni di popolazione che non rappresentano accuratamente l’intero gruppo target. Ad esempio, i dati tratti da un solo quartiere non rappresentano con precisione una grande città. Sono molti i motivi per cui può insorgere un bias di selezione, alcuni intenzionali e altri no. Alcuni esempi comprendono la partecipazione volontaria a un programma, fattori limitanti per la partecipazione o dimensioni insufficienti del campione.
Bias degli outlier
Gli outlier possono alterare significativamente i dati. Ad esempio, quando si analizzano i dati sul reddito negli Stati Uniti, ci sono alcuni individui estremamente ricchi il cui reddito può alterare il calcolo delle medie. Per questo motivo, il valore mediano è spesso una rappresentazione più accurata della popolazione in generale.
Bias dell’osservatore
Il bias dell’osservatore è un tipo di bias statistico che deriva dalla soggettività dell’osservatore. Nessun essere umano è completamente imparziale e quindi il bias dell’osservatore è sempre un problema. L’approccio migliore è imparare a conoscere questo bias.
Un esempio di questo bias è un test sui ratti eseguito negli anni ’60 in cui a due gruppi di studenti venne chiesto di testare ratti categorizzati come “intelligenti” e “stupidi”. Gli studenti che avevano ricevuti i ratti “stupidi” li gestirono male e ridussero le loro possibilità di completare il labirinto, il che alla fine ebbe un impatto sui risultati dello studio.
Bias di finanziamento
Il bias di finanziamento si riferisce alla probabilità che uno studio tenda a favorire la persona che lo ha sovvenzionato. Questi studi tendono a fornire dati inaccurati che possono rendere difficile la loro applicazione alla tua attività.
Il bias di finanziamento è particolarmente popolare nei confronti fra prodotti. Se Bounty finanzia un confronto fra tipi di carta assorbente per cucina, tale confronto è molto più probabile che favorisca Bounty rispetto a un altro brand.
Bias della variabile omessa
Nel caso del bias della variabile omessa, è la mancanza di una variabile a influire sulla legittimità della statistica. Ad esempio, uno studio sulle auto che non include l’anno o il chilometraggio può fornire risultati imprecisi.
Il bias della variabile omessa è uno dei tipi più comuni di bias in statistica. Quando esamini i dati, assicurati che questi tengano conto di tutte le variabili rilevanti.
Bias del sopravvissuto
Il bias del sopravvissuto si verifica quando si tiene conto solo dei punti dati sopravvissuti. Se non si tiene conto di tutte le potenziali fonti di dati, è possibile che la rappresentazione dei dati ne risulti errata.
Un classico esempio di bias del sopravvissuto è la Seconda Guerra Mondiale, quando si sono studiati gli aerei sopravvissuti per rinforzarli dove erano stati colpiti di più. In realtà, sarebbe stato meglio esaminare gli aerei abbattuti e rinforzare i modelli futuri nei punti in cui tali aerei erano stati colpiti e abbattuti.