Articles

T-Test

t-test hodnotí, zda jsou prostředky dvou skupin statisticky odlišné od sebe. Tuto analýzu je vhodné vždy, když chcete porovnávat průměry dvou skupin, a to zejména vhodné jako analýzy pro posttest-pouze dvě skupiny randomizované experimentální design.

Obrázek 1. Idealizované distribuce pro ošetřené a srovnávací skupiny posttestových hodnot.

Obrázek 1 ukazuje rozdělení pro léčené (modré) a kontrolní (zelené) skupiny ve studii. Ve skutečnosti obrázek ukazuje idealizované rozdělení – skutečné rozdělení by bylo obvykle zobrazeno histogramem nebo sloupcovým grafem. Obrázek ukazuje, kde jsou umístěny prostředky kontrolní a léčebné skupiny. Otázkou, kterou t-test řeší, je, zda jsou prostředky statisticky odlišné.

Co to znamená říci, že průměry pro dvě skupiny jsou statisticky odlišné? Zvažte tři situace znázorněné na obrázku 2. První věc, kterou si všimnete o třech situacích, je, že rozdíl mezi prostředky je stejný ve všech třech. Ale měli byste si také všimnout, že tyto tři situace nevypadají stejně-vyprávějí velmi odlišné příběhy. Nejlepší příklad ukazuje případ s mírnou variabilitou skóre v každé skupině. Druhá situace ukazuje případ vysoké variability. třetí ukazuje případ s nízkou variabilitou. Jasně, dospěli bychom k závěru, že tyto dvě skupiny se v případě spodní nebo nízké variability zdají nejvíce odlišné nebo odlišné. Proč? Protože mezi dvěma křivkami ve tvaru zvonu je relativně malé překrytí. V případě vysoké variability se rozdíl ve skupině jeví jako nejméně nápadný, protože se dvě zvonovité distribuce tolik překrývají.

Obrázek 2. Tři scénáře pro rozdíly mezi prostředky.

To nás vede k velmi důležitému závěru: když se podíváme na rozdíly mezi výsledky u dvou skupin, musíme posoudit rozdíl mezi jejich prostředky vzhledem k šíření nebo variabilita jejich skóre. T-test dělá právě toto.

Statistická analýza t-testu

vzorec pro T-test je poměr. Horní část poměru je jen rozdíl mezi dvěma prostředky nebo průměry. Spodní část je měřítkem variability nebo rozptylu skóre. Tento vzorec je v podstatě další příklad signál-šum metafora ve výzkumu: rozdíl mezi průměry je signál, že v tomto případě, si myslíme, že náš program nebo léčba zavedena do dat; spodní část vzorce je měřítkem variability, která je v podstatě šum, který může dělat to těžší vidět skupinu rozdíl. Obrázek 3 ukazuje vzorec pro t-test a jak čitatel a jmenovatel souvisí s rozdělením.

obrázek 3. Vzorec pro t-test.

horní část vzorce je snadno vypočítatelná – stačí najít rozdíl mezi prostředky. Spodní část se nazývá standardní chyba rozdílu. Abychom to vypočítali, vezmeme rozptyl pro každou skupinu a vydělíme ji počtem lidí v této skupině. Přidáme tyto dvě hodnoty a pak vezmeme jejich druhou odmocninu. Specifický vzorec pro standardní chybu rozdílu mezi prostředky je:

$$\textrm{SE}(\bar{X}_T-\bar{X}_C) = \sqrt{\frac{\textrm{var}_T}{n_T}+\frac{\textrm{var}_C}{n_C}}$$

Pamatujte, že rozptyl je prostě čtverec směrodatné odchylky.

konečné vzorce pro t-test je:

$$t = \frac{\bar{X}_T-\bar{X}_C}{\sqrt{\frac{\textrm{var}_T}{n_T}+\frac{\textrm{var}_C}{n_C}}}$$

t-hodnota bude pozitivní, pokud první průměr je větší než druhá a negativní, pokud je menší. Jakmile si vypočítat t-hodnota musíš se podívat do tabulky význam pro test, zda je tento poměr dostatečně velký, aby se říci, že rozdíl mezi skupinami není pravděpodobné, že byly šanci najít. Chcete-li otestovat význam, musíte nastavit úroveň rizika(nazývanou alfa úroveň). Ve většině sociálních výzkumů je „pravidlem“ nastavit úroveň alfa na .05. To znamená, že pětkrát ze sta byste našli statisticky významný rozdíl mezi prostředky, i když žádný nebyl (tj. Musíte také určit stupně volnosti (df) pro test. V t-test je míra volnosti součtem osob v obou skupinách minus 2. Dané hladině alfa, df, a t-hodnota, můžete se podívat na t-hodnoty v normě tabulka významnosti (k dispozici jako příloha v zadní části většiny statistik texty) k určení, zda t-hodnota je dostatečně velká, aby být významné. Pokud ano, můžete dojít k závěru ,že rozdíl mezi prostředky pro obě skupiny je odlišný (i vzhledem k variabilitě). Naštěstí statistické počítačové programy běžně tisknou výsledky testů významnosti a ušetří vám potíže s jejich vyhledáním v tabulce.

t-test, Analýza Rozptylu (ANOVA) a formou regresní analýzy jsou matematicky ekvivalentní (viz statistická analýza posttest-pouze randomizované experimentální design) a přinese totožné výsledky.