Es gibt verschiedene Arten von statistischer Verzerrung und das Vermeiden und Verstehen dieser hilft dir, Daten besser zu interpretieren. Nachfolgend findest du einige der statistischen Verzerrungen, auf die du stoßen kannst.
Bestätigungstendenz
Eine Bestätigungstendenz ist ein Fehler, bei dem eine vorgefasste Vorstellung beeinflussen kann, wie du Informationen priorisierst oder interpretierst. Ein Beispiel für eine Bestätigungstendenz wäre, wenn du der festen Überzeugung bist, dass die meisten Menschen Vanilleeis gegenüber Schokoladeneis bevorzugen und daher den Daten, die diese Schlussfolgerung stützen, mehr Gewicht beimisst.
Selektionsverzerrung
Eine Selektionsverzerrung ist ein Fehler, der sich aus der Verwendung von Bevölkerungsstichproben ergibt, die nicht die gesamte Zielgruppe korrekt repräsentieren. Zum Beispiel würden Daten eines Stadtteils nicht die gesamte Stadt genau darstellen. Selektionsverzerrungen haben vielerlei Gründe – einige absichtlich, andere nicht – einschließlich freiwilliger Teilnahme, einschränkender Faktoren für die Teilnahme oder unzureichender Stichprobengröße.
Ausreißerverzerrung
Ausreißer können Daten erheblich verzerren. Bei der Analyse des Einkommens in den USA fließen beispielsweise die Gehälter von Spitzenverdienern ein, was die Berechnung des Durchschnitts verzerren kann. Aus diesem Grund repräsentiert ein Mittelwert eine größere Bevölkerung häufig besser.
Beobachter-Bias
Beobachter-Bias ist eine Art statistische Verzerrung, die aufgrund der Subjektivität des Beobachters verfälscht ist. Niemand ist völlig unvoreingenommen, daher werden die Beobachter-Bias immer problematisch sein. Ein guter Anfang ist, dass du dir darüber bewusst bist.
Ein Beispiel dafür war ein in den 1960ern durchgeführter Test mit Ratten, in dem zwei Studentengruppen Versuche mit Ratten durchführten, die als „lebendig“ und „langweilig“ kategorisiert wurden. Die Studenten, die die „langweiligen“ Nager hatten, behandelten sie schlecht und reduzierten ihre Chancen, durchs Labyrinth zu kommen, was letztendlich die Ergebnisse der Studie beeinflusste.
Finanzierungsverzerrungen
Die Finanzierungsverzerrung bezieht sich auf die Wahrscheinlichkeit, dass eine Studie zugunsten der Partei ausfällt, die sie finanziert hat. Diese Studien liefern in der Regel ungenaue Daten, die es schwierig machen können, diese Daten auf dein Unternehmen anzuwenden.
Finanzierungsverzerrungen sind bei Produktvergleichen besonders beliebt. Wenn Bounty für einen Produktvergleich bezahlt, ist es viel wahrscheinlicher, dass Bounty bei diesem Test besser abschneidet.
Verzerrung durch ausgelassene Variablen
Die Verzerrung bei ausgelassenen Variablen beeinflusst die Legitimität der Statistik. Eine Studie über Autos, die das Baujahr oder den Kilometerstand nicht berücksichtigt, kann zum Beispiel zu ungenauen Ergebnissen führen.
Verzerrung durch ausgelassene Variablen ist eines der häufigsten Beispiele für statistische Verzerrungen. Achte bei der Datenanalyse darauf, dass alle relevanten Variablen berücksichtigt werden.
Survivorship-Bias
Ein Survivorship-Bias liegt vor, wenn du nur erfolgreiche Datenpunkte berücksichtigst. Wird nicht jede potenzielle Datenquelle berücksichtigt, ist die repräsentative Darstellung der Daten häufig verfälscht.
Ein klassisches Beispiel für Survivorship-Bias ist der Zweite Weltkrieg, als heil gebliebene Flugzeuge untersucht wurden, um sie an Stellen zu verstärken, wo sie am häufigsten beschossen wurden. Klüger wäre es gewesen, sich abgeschossene Flugzeuge anzuschauen und neue Modelle an den Stellen zu verstärken, an denen diese Flugzeuge getroffen und beschädigt wurden.