Test T
test t ocenia, czy średnie dwóch grup są statystycznie różne od siebie. Ta analiza jest odpowiednia, gdy chcesz porównać środki z dwóch grup, a szczególnie odpowiednia jako analiza dla posttestu-tylko dwie grupy randomizowanego projektu eksperymentalnego.
Rysunek 1. Wyidealizowane dystrybucje dla traktowanych i porównywanych wartości grupy posttest.
rycina 1 przedstawia rozkład dla leczonych (niebieskich) i kontrolnych (zielonych) grup w badaniu. W rzeczywistości, rysunek pokazuje rozkład wyidealizowany-rzeczywisty rozkład byłby Zwykle przedstawiony histogramem lub wykresem słupkowym. Rysunek wskazuje, gdzie znajdują się środki grupy kontrolnej i grupy terapeutycznej. Pytanie, które zadaje test t, brzmi, czy środki są statystycznie różne.
Co to znaczy powiedzieć, że średnie dla dwóch grup są statystycznie różne? Rozważmy trzy sytuacje pokazane na rysunku 2. Pierwszą rzeczą, którą należy zauważyć w tych trzech sytuacjach, jest to, że różnica między środkami jest taka sama we wszystkich trzech. Ale należy również zauważyć, że te trzy sytuacje nie wyglądają tak samo-opowiadają bardzo różne historie. Górny przykład pokazuje przypadek z umiarkowaną zmiennością wyników w każdej grupie. Druga sytuacja pokazuje przypadek wysokiej zmienności. trzeci pokazuje przypadek z małą zmiennością. Oczywiście doszlibyśmy do wniosku, że te dwie grupy wydają się najbardziej różne lub odrębne w przypadku dolnej lub niskiej zmienności. Dlaczego? Ponieważ jest stosunkowo niewiele nakładania się między dwoma krzywymi w kształcie dzwonu. W przypadku dużej zmienności różnica grup wydaje się najmniej uderzająca, ponieważ dwa rozkłady w kształcie dzwonu pokrywają się tak bardzo.
Rysunek 2. Trzy scenariusze różnic między środkami.
to prowadzi nas do bardzo ważnego wniosku: kiedy patrzymy na różnice między wynikami dla dwóch grup, musimy ocenić różnicę między ich środkami w stosunku do rozpiętości lub zmienności ich wyników. Test t robi właśnie to.
Analiza statystyczna testu t
wzór na test t jest współczynnikiem. Górna część stosunku to tylko różnica między dwiema średnimi lub średnimi. Dolna część jest miarą zmienności lub rozproszenia partytur. Ta formuła jest w istocie innym przykładem metafory sygnału do szumu w badaniach: różnica między środkami jest sygnałem, który w tym przypadku uważamy, że nasz program lub leczenie wprowadzone do danych; dolna część formuły jest miarą zmienności, która jest zasadniczo szumem, który może utrudnić dostrzeżenie różnicy grupowej. Rysunek 3 przedstawia wzór na test t oraz sposób, w jaki licznik i mianownik są powiązane z rozkładami.
Rysunek 3. Wzór na test T.
górna część wzoru jest łatwa do obliczenia – wystarczy znaleźć różnicę między środkami. Dolna część nazywana jest standardowym błędem różnicy. Aby to obliczyć, bierzemy wariancję dla każdej grupy i dzielimy ją przez liczbę osób w tej grupie. Dodajemy te dwie wartości i bierzemy ich pierwiastek kwadratowy. Specyficznym wzorem błędu standardowego różnicy między środkami jest:
$$\textrm{SE}(\bar{X}_T-\bar{X}_C) = \sqrt{\frac{\textrm{var}_T}{n_T}+\frac{\textrm{var}_C}{n_c}}$$
pamiętaj, że wariancja jest po prostu kwadratem odchylenia standardowego.
ostateczny wzór dla T-testu to:
$$t = \frac{\bar{X}_T-\bar{X}_C}{\sqrt{\frac{\textrm{var}_T}{n_t}+\frac{\textrm{var}_c}{n_c}}$$
t
-wartość będzie dodatnia, jeśli pierwsza średnia jest większa od drugiej i ujemna, jeśli jest mniejsza. Po obliczeniu wartościt
musisz ją odszukać w tabeli istotności, aby sprawdzić, czy stosunek jest wystarczająco duży, aby stwierdzić, że różnica między grupami prawdopodobnie nie była przypadkiem. Aby sprawdzić znaczenie, musisz ustawić poziom ryzyka (zwany poziomem Alfa). W większości badań społecznych „zasadą kciuka” jest ustawienie poziomu alfa na .05
. Oznacza to, że pięć razy na sto można znaleźć statystycznie istotną różnicę między środkami, nawet jeśli nie było (to znaczy, przez „przypadek”). Musisz również określić stopnie swobody (DF) dla testu. W t-test
stopnie swobody są sumą osób w obu grupach minus 2
. Biorąc pod uwagę poziom alfa, df i t
-wartość, możesz spojrzeć na t
-wartość w górę w standardowej tabeli istotności (dostępnej jako dodatek w tylnej części większości tekstów statystycznych), aby określić, czy t
-wartość jest wystarczająco duża, aby była znacząca. Jeśli tak, można wywnioskować, że różnica między środkami dla dwóch grup jest inna (nawet biorąc pod uwagę zmienność). Na szczęście statystyczne programy komputerowe rutynowo drukują wyniki testu istotności i oszczędzają kłopotu z wyszukiwaniem ich w tabeli.
test t, jednokierunkowa Analiza wariancji (ANOVA) i forma analizy regresji są matematycznie równoważne (patrz Analiza statystyczna randomizowanego projektu eksperymentalnego tylko po teście) i dałyby identyczne wyniki.