Articles

A T-teszt

A t-teszt azt értékeli, hogy a két csoport átlaga statisztikailag különbözik-e egymástól. Ez az elemzés akkor megfelelő, amikor két csoport eszközeit szeretné összehasonlítani, és különösen megfelelő, mint a csak a teszt utáni kétcsoportos randomizált kísérleti tervezés elemzése.

1.ábra. Idealizált eloszlások a kezelt és összehasonlító csoport posttest értékeihez.

az 1. ábra a kezelt (kék) és a kontroll (zöld) csoportok eloszlását mutatja egy vizsgálatban. Valójában az ábra az idealizált eloszlást mutatja – a tényleges eloszlást általában hisztogrammal vagy oszlopdiagrammal ábrázolják. Az ábra azt jelzi, hogy hol található a kontroll és a kezelési csoport eszköze. A T-teszt kérdése az, hogy az eszközök statisztikailag különböznek-e.

mit jelent az, hogy két csoport átlaga statisztikailag eltérő? Tekintsük a 2. ábrán látható három helyzetet. Az első dolog, amit észre kell venni a három helyzetben, az, hogy az eszközök közötti különbség mindhárom esetben azonos. De azt is észre kell vennie, hogy a három helyzet nem ugyanaz – nagyon különböző történeteket mesélnek el. A legfelső példa egy olyan esetet mutat be, amelyben az egyes csoportokon belül a pontszámok mérsékelten változékonyak. A második helyzet a nagy variabilitási esetet mutatja. a harmadik az alacsony változékonyságú esetet mutatja. Tisztán, arra a következtetésre jutnánk, hogy a két csoport az alsó vagy az alacsony változékonyságú esetben tűnik a legkülönbözőbbnek vagy a legkülönbözőbbnek. Miért? Mivel a két harang alakú görbe között viszonylag kevés az átfedés. Nagy variabilitás esetén a csoportkülönbség a legkevésbé szembetűnőnek tűnik, mert a két harang alakú Eloszlás annyira átfedi egymást.

2.ábra. Három forgatókönyv az eszközök közötti különbségekre.

Ez egy nagyon fontos következtetéshez vezet: amikor két csoport pontszáma közötti különbségeket vizsgáljuk, meg kell ítélnünk az átlaguk közötti különbséget a pontszámok terjedéséhez vagy változékonyságához viszonyítva. A t-teszt éppen ezt teszi.

A T-teszt statisztikai elemzése

a T-teszt képlete egy Arány. Az arány felső része csak a két átlag vagy átlag közötti különbség. Az alsó rész a pontszámok változékonyságának vagy diszperziójának mértéke. Ez a képlet lényegében egy másik példa a jel-zaj metaforára a kutatásban: az eszközök közötti különbség az a jel, amely ebben az esetben azt gondoljuk, hogy programunk vagy kezelésünk bekerült az adatokba; a képlet alsó része a változékonyság mértéke, amely lényegében zaj, amely megnehezítheti a csoportkülönbség észlelését. A 3. ábra a t-teszt képletét mutatja, valamint azt, hogy a számláló és a nevező hogyan viszonyul az eloszlásokhoz.

3.ábra. A t-teszt képlete.

a képlet felső része könnyen kiszámítható – csak keresse meg a különbséget az eszközök között. Az alsó részt a különbség standard hibájának nevezzük. Ennek kiszámításához vesszük az egyes csoportok varianciáját, és elosztjuk az adott csoportban lévő emberek számával. Hozzáadjuk ezt a két értéket, majd négyzetgyöküket vesszük. Az eszközök közötti különbség standard hibájának konkrét képlete:

$$ \ textrm{SE} (\bar{X}_T-\bar{X}_C) = \sqrt {\frac {\textrm{var}_t}{n_T}+\frac {\textrm{var}_c}{n_C}}$$

ne feledje, hogy a szórás egyszerűen a szórás négyzete.

a t-teszt végső képlete:

$$t = \frac{\bar{X}_T-\bar{X}_C}{\sqrt{\FRAC{\textrm{var}_t}{n_T}+\frac{\textrm{var}_c}{n_C}}$$

a t-az érték pozitív lesz, ha az első átlag nagyobb, mint a második, negatív, ha kisebb. Miután kiszámította a t -értéket, meg kell keresnie egy szignifikancia táblázatban, hogy tesztelje, hogy az arány elég nagy-e ahhoz, hogy azt mondja, hogy a csoportok közötti különbség valószínűleg nem volt véletlen. A jelentőség teszteléséhez be kell állítania egy kockázati szintet (az alfa szintet). A legtöbb társadalmi kutatásban a “hüvelykujjszabály” az alfa szint beállítása .05. Ez azt jelenti, hogy százból ötször statisztikailag szignifikáns különbséget talál az eszközök között, még akkor is, ha nincs ilyen (azaz “véletlenül”). Meg kell határoznia a teszt szabadságfokait (df) is. A t-test – ben a szabadság foka a két csoportban lévő személyek összege mínusz 2. Az alfa szintet, a df-et és a t-értéket figyelembe véve a t-értéket a standard szignifikanciatáblázatban (a legtöbb statisztikai szöveg hátulján függelékként Elérhető) fel lehet keresni annak megállapításához, hogy a t-érték elég nagy-e ahhoz, hogy jelentős legyen. Ha igen, akkor arra a következtetésre juthat, hogy a két csoport eszközei közötti különbség eltérő (még a változékonyság miatt is). Szerencsére a statisztikai számítógépes programok rendszeresen kinyomtatják a szignifikancia teszt eredményeit, és megtakarítják a fáradságot, hogy egy táblázatban keressék őket.

a T-teszt, az egyirányú varianciaanalízis (ANOVA) és a regresszióanalízis egy formája matematikailag egyenértékű (lásd a csak a teszt utáni randomizált kísérleti terv statisztikai elemzését), és azonos eredményeket hozna.