Articles

Der T-Test

Der t-Test bewertet, ob sich die Mittelwerte zweier Gruppen statistisch voneinander unterscheiden. Diese Analyse eignet sich immer dann, wenn Sie die Mittelwerte zweier Gruppen vergleichen möchten, und insbesondere als Analyse für das randomisierte experimentelle Design mit nur zwei Gruppen nach dem Test.

Abbildung 1. Idealisierte Verteilungen für behandelte und Vergleichsgruppen-Posttest-Werte.

Abbildung 1 zeigt die Verteilungen für die behandelten (blau) und Kontrollgruppen (grün) in einer Studie. Tatsächlich zeigt die Abbildung die idealisierte Verteilung – die tatsächliche Verteilung wird normalerweise mit einem Histogramm oder Balkendiagramm dargestellt. Die Figur gibt an, wo sich die Kontroll- und Behandlungsgruppenmittel befinden. Die Frage, die der t-Test adressiert, ist, ob die Mittelwerte statistisch unterschiedlich sind.

Was bedeutet es zu sagen, dass die Durchschnittswerte für zwei Gruppen statistisch unterschiedlich sind? Betrachten Sie die drei in Abbildung 2 gezeigten Situationen. Das erste, was bei den drei Situationen zu beachten ist, ist, dass der Unterschied zwischen den Mitteln in allen drei gleich ist. Aber Sie sollten auch beachten, dass die drei Situationen nicht gleich aussehen – sie erzählen sehr unterschiedliche Geschichten. Das obere Beispiel zeigt einen Fall mit mäßiger Variabilität der Scores innerhalb jeder Gruppe. Die zweite Situation zeigt den Fall der hohen Variabilität. der dritte zeigt den Fall mit geringer Variabilität. Klar, Wir würden daraus schließen, dass die beiden Gruppen im Fall der unteren oder niedrigen Variabilität am unterschiedlichsten oder ausgeprägtesten erscheinen. Warum? Weil es relativ wenig Überlappung zwischen den beiden glockenförmigen Kurven gibt. Im Fall der hohen Variabilität erscheint der Gruppenunterschied am wenigsten auffällig, da sich die beiden glockenförmigen Verteilungen so stark überlappen.

Abbildung 2. Drei Szenarien für Unterschiede zwischen den Mitteln.

Dies führt uns zu einer sehr wichtigen Schlussfolgerung: Wenn wir die Unterschiede zwischen den Punktzahlen für zwei Gruppen betrachten, müssen wir den Unterschied zwischen ihren Mittelwerten im Verhältnis zur Verbreitung oder Variabilität ihrer Punktzahlen beurteilen. Der t-Test macht genau das.

Statistische Analyse des T-Tests

Die Formel für den t-Test ist ein Verhältnis. Der obere Teil des Verhältnisses ist nur die Differenz zwischen den beiden Mitteln oder Durchschnittswerten. Der untere Teil ist ein Maß für die Variabilität oder Streuung der Scores. Diese Formel ist im Wesentlichen ein weiteres Beispiel für die Signal-Rausch-Metapher in der Forschung: Der Unterschied zwischen den Mitteln ist das Signal, dass wir in diesem Fall denken, dass unser Programm oder unsere Behandlung in die Daten eingeführt wurde; Der untere Teil der Formel ist ein Maß für die Variabilität, das im Wesentlichen Rauschen ist, das es schwieriger machen kann, den Gruppenunterschied zu erkennen. Abbildung 3 zeigt die Formel für den t-Test und wie Zähler und Nenner mit den Verteilungen zusammenhängen.

Abbildung 3. Formel für den T-Test.

Der obere Teil der Formel ist einfach zu berechnen – finden Sie einfach den Unterschied zwischen den Mitteln. Der untere Teil wird als Standardfehler der Differenz bezeichnet. Um es zu berechnen, nehmen wir die Varianz für jede Gruppe und dividieren sie durch die Anzahl der Personen in dieser Gruppe. Wir addieren diese beiden Werte und nehmen dann ihre Quadratwurzel. Die spezifische Formel für den Standardfehler der Differenz zwischen den Mitteln lautet:

$$\textrm{SE}(\bar{X}_T-\bar{X}_C) = \sqrt{\frac{\textrm{var}_T}{n_T}+\frac{\textrm{var}_C}{n_C}}$$

Denken Sie daran, dass die Varianz einfach das Quadrat der Standardabweichung ist.

Die endgültige Formel für den t-Test lautet:

$$t = \frac{\bar{X}_T-\bar{X}_C}{\sqrt{\frac{\textrm{var}_T}{n_T}+\frac{\textrm{var}_C}{n_C}}}$$

Die t -der Wert ist positiv, wenn der erste Mittelwert größer als der zweite ist, und negativ, wenn er kleiner ist. Sobald Sie den t -Wert berechnet haben, müssen Sie ihn in einer Signifikanztabelle nachschlagen, um zu testen, ob das Verhältnis groß genug ist, um zu sagen, dass der Unterschied zwischen den Gruppen wahrscheinlich kein Zufall ist. Um die Signifikanz zu testen, müssen Sie ein Risikoniveau (das sogenannte Alpha-Niveau) festlegen. In den meisten Sozialforschungen besteht die „Faustregel“ darin, den Alpha-Pegel auf .05 . Dies bedeutet, dass Sie fünfmal von hundert einen statistisch signifikanten Unterschied zwischen den Mitteln finden würden, selbst wenn es keinen gäbe (dh durch „Zufall“). Sie müssen auch die Freiheitsgrade (df) für den Test bestimmen. Im t-test sind die Freiheitsgrade die Summe der Personen in beiden Gruppen minus 2. Angesichts des Alpha-Levels, des df und des t -Wertes können Sie den t -Wertes in einer Standard-Signifikanztabelle (als Anhang auf der Rückseite der meisten Statistiktexte verfügbar) nachschlagen, um festzustellen, ob der t -Wert groß genug ist, um signifikant zu sein. Wenn ja, können Sie daraus schließen, dass der Unterschied zwischen den Mitteln für die beiden Gruppen unterschiedlich ist (selbst angesichts der Variabilität). Glücklicherweise drucken statistische Computerprogramme routinemäßig die Ergebnisse des Signifikanztests aus und ersparen Ihnen die Mühe, sie in einer Tabelle nachzuschlagen.

Der T-Test, die Einweg-Varianzanalyse (ANOVA) und eine Form der Regressionsanalyse sind mathematisch äquivalent (siehe statistische Analyse des randomisierten experimentellen Designs nur nach dem Test) und würden identische Ergebnisse liefern.