Il T-Test
Il t-test valuta se i mezzi di due gruppi sono statisticamente diversi l’uno dall’altro. Questa analisi è appropriata ogni volta che si desidera confrontare i mezzi di due gruppi, e particolarmente appropriato come l’analisi per il posttest-solo due gruppi randomizzati disegno sperimentale.
Figura 1. Distribuzioni idealizzate per i valori post-test del gruppo trattato e di confronto.
La figura 1 mostra le distribuzioni per i gruppi trattati (blu) e di controllo (verde) in uno studio. In realtà, la figura mostra la distribuzione idealizzata-la distribuzione effettiva di solito sarebbe raffigurata con un istogramma o un grafico a barre. La figura indica dove si trovano i mezzi del gruppo di controllo e di trattamento. La domanda che il t-test affronta è se i mezzi sono statisticamente diversi.
Cosa significa dire che le medie per due gruppi sono statisticamente diverse? Considerate le tre situazioni mostrate in Figura 2. La prima cosa da notare sulle tre situazioni è che la differenza tra i mezzi è la stessa in tutti e tre. Ma, si dovrebbe anche notare che le tre situazioni non hanno lo stesso aspetto – raccontano storie molto diverse. L’esempio in alto mostra un caso con variabilità moderata dei punteggi all’interno di ciascun gruppo. La seconda situazione mostra il caso di alta variabilità. il terzo mostra il caso con bassa variabilità. Chiaramente, concluderemmo che i due gruppi appaiono più diversi o distinti nel caso di bassa o bassa variabilità. Perché? Perché c’è relativamente poca sovrapposizione tra le due curve a forma di campana. Nel caso di alta variabilità, la differenza di gruppo appare meno sorprendente perché le due distribuzioni a forma di campana si sovrappongono così tanto.
Figura 2. Tre scenari per le differenze tra i mezzi.
Questo ci porta a una conclusione molto importante: quando guardiamo le differenze tra i punteggi per due gruppi, dobbiamo giudicare la differenza tra i loro mezzi rispetto alla diffusione o alla variabilità dei loro punteggi. Il t-test fa proprio questo.
Analisi statistica del t-test
La formula per il t-test è un rapporto. La parte superiore del rapporto è solo la differenza tra i due mezzi o medie. La parte inferiore è una misura della variabilità o dispersione dei punteggi. Questa formula è essenzialmente un altro esempio della metafora segnale-rumore nella ricerca: la differenza tra i mezzi è il segnale che, in questo caso, pensiamo che il nostro programma o trattamento introdotto nei dati; la parte inferiore della formula è una misura di variabilità che è essenzialmente rumore che può rendere più difficile vedere la differenza di gruppo. La figura 3 mostra la formula per il t-test e come il numeratore e il denominatore sono correlati alle distribuzioni.
Figura 3. Formula per il t-test.
La parte superiore della formula è facile da calcolare – basta trovare la differenza tra i mezzi. La parte inferiore è chiamata errore standard della differenza. Per calcolarlo, prendiamo la varianza per ogni gruppo e la dividiamo per il numero di persone in quel gruppo. Aggiungiamo questi due valori e poi prendiamo la loro radice quadrata. La formula specifica per l’errore standard della differenza tra i mezzi è:
$ $ \textrm{SE}(\bar{X}_T-\bar{X}_C) = \sqrt{\frac{\textrm{var}_T}{n_T}+\frac{\textrm{var}_C}{n_C}} Remember
Ricorda che la varianza è semplicemente il quadrato della deviazione standard.
La formula finale per il t-test è:
$$t = \frac{\bar{X}_T-\bar{X}_C}{\sqrt{\frac{\textrm{var}_T}{n_T}+\frac{\textrm{var}_C}{n_C}}}$$
t
valore sarà positivo se la prima media è maggiore del secondo e negativo se è più piccola. Una volta calcolato il valore t
, devi cercarlo in una tabella di importanza per verificare se il rapporto è abbastanza grande da dire che la differenza tra i gruppi non è probabile che sia stata una scoperta casuale. Per verificare la significatività, è necessario impostare un livello di rischio (chiamato livello alfa). Nella maggior parte delle ricerche sociali, la “regola empirica”è quella di impostare il livello alfa su .05
. Ciò significa che cinque volte su cento si troverebbe una differenza statisticamente significativa tra i mezzi anche se non ce n’era (cioè per “caso”). È inoltre necessario determinare i gradi di libertà (df) per il test. Nel t-test
, i gradi di libertà sono la somma delle persone in entrambi i gruppi meno 2
. Dato il livello alfa, il df e il valoret
, è possibile cercare il valoret
in una tabella di significatività standard (disponibile come appendice nella parte posteriore della maggior parte dei testi statistici) per determinare se il valoret
è abbastanza grande da essere significativo. Se lo è, puoi concludere che la differenza tra i mezzi per i due gruppi è diversa (anche data la variabilità). Fortunatamente, programmi informatici statistici regolarmente stampare i risultati del test di significatività e risparmiare la fatica di cercarli in una tabella.
Il t-test, l’analisi unidirezionale della varianza (ANOVA) e una forma di analisi di regressione sono matematicamente equivalenti (vedi l’analisi statistica del progetto sperimentale randomizzato solo posttest) e produrrebbero risultati identici.