Le test T
Le test t évalue si les moyennes de deux groupes sont statistiquement différentes l’une de l’autre. Cette analyse est appropriée chaque fois que vous souhaitez comparer les moyennes de deux groupes, et particulièrement appropriée comme analyse pour le plan expérimental randomisé à deux groupes seulement après le test.
Figure 1. Distributions idéalisées pour les valeurs post-test traitées et du groupe témoin.
La figure 1 montre les distributions pour les groupes traités (bleu) et témoins (vert) dans une étude. En fait, la figure montre la distribution idéalisée – la distribution réelle serait généralement représentée avec un histogramme ou un graphique à barres. La figure indique où se trouvent les moyens de groupe de contrôle et de traitement. La question que pose le test t est de savoir si les moyennes sont statistiquement différentes.
Que signifie dire que les moyennes pour deux groupes sont statistiquement différentes? Considérons les trois situations illustrées à la figure 2. La première chose à remarquer à propos des trois situations est que la différence entre les moyens est la même dans les trois. Mais, vous devriez également remarquer que les trois situations ne se ressemblent pas – elles racontent des histoires très différentes. L’exemple du haut montre un cas avec une variabilité modérée des scores au sein de chaque groupe. La deuxième situation montre le cas de la grande variabilité. le troisième montre le cas avec une faible variabilité. De toute évidence, nous conclurons que les deux groupes semblent les plus différents ou distincts dans le cas de la variabilité inférieure ou faible. Pourquoi? Parce qu’il y a relativement peu de chevauchement entre les deux courbes en forme de cloche. Dans le cas de la variabilité élevée, la différence de groupe semble moins frappante parce que les deux distributions en forme de cloche se chevauchent tellement.
Figure 2. Trois scénarios de différences entre les moyens.
Cela nous amène à une conclusion très importante: lorsque nous examinons les différences entre les scores de deux groupes, nous devons juger de la différence entre leurs moyennes par rapport à l’écart ou à la variabilité de leurs scores. Le test t fait exactement cela.
Analyse statistique du test t
La formule du test t est un rapport. La partie supérieure du rapport est juste la différence entre les deux moyennes ou moyennes. La partie inférieure est une mesure de la variabilité ou de la dispersion des scores. Cette formule est essentiellement un autre exemple de la métaphore signal sur bruit dans la recherche: la différence entre les moyennes est le signal que, dans ce cas, nous pensons que notre programme ou traitement est introduit dans les données; la partie inférieure de la formule est une mesure de variabilité qui est essentiellement du bruit qui peut rendre plus difficile de voir la différence de groupe. La figure 3 montre la formule du test t et la relation entre le numérateur et le dénominateur et les distributions.
Figure 3. Formule pour le test t.
La partie supérieure de la formule est facile à calculer – il suffit de trouver la différence entre les moyennes. La partie inférieure est appelée l’erreur standard de la différence. Pour le calculer, nous prenons la variance pour chaque groupe et la divisons par le nombre de personnes dans ce groupe. Nous ajoutons ces deux valeurs puis prenons leur racine carrée. La formule spécifique de l’erreur type de la différence entre les moyennes est:
$$\textrm{SE}(\bar{X}_T-\bar{X}_C)= \sqrt{\frac{\textrm{var}_T}{n_T} + \frac{\textrm{var}_C}{n_C}}Remember
Rappelez-vous que la variance est simplement le carré de l’écart type.
La formule finale du test t est la suivante :
tt=\frac{\bar{X}_T-\bar{X}_C}{\sqrt{\frac{\textrm{var}_T}{n_T}+\frac{\textrm{var}_C}{n_C}}}$$
Le t
– la valeur sera positive si la première moyenne est plus grande que la seconde et négative si elle est plus petite. Une fois que vous avez calculé la valeur t
, vous devez la rechercher dans un tableau de signification pour tester si le rapport est suffisamment grand pour dire que la différence entre les groupes n’est probablement pas une découverte fortuite. Pour tester la signification, vous devez définir un niveau de risque (appelé niveau alpha). Dans la plupart des recherches sociales, la « règle empirique » consiste à définir le niveau alpha à .05
. Cela signifie que cinq fois sur cent, vous trouverez une différence statistiquement significative entre les moyens même s’il n’y en avait pas (c’est-à-dire par « hasard »). Vous devez également déterminer les degrés de liberté (df) pour le test. Dans le t-test
, les degrés de liberté sont la somme des personnes des deux groupes moins 2
. Compte tenu du niveau alpha, du df et de la valeur t
, vous pouvez rechercher la valeur t
dans un tableau standard de signification (disponible en annexe à la fin de la plupart des textes de statistiques) pour déterminer si la valeur t
est suffisamment grande pour être significative. Si c’est le cas, vous pouvez conclure que la différence entre les moyennes pour les deux groupes est différente (même compte tenu de la variabilité). Heureusement, les programmes informatiques statistiques impriment régulièrement les résultats des tests de signification et vous évitent la peine de les rechercher dans un tableau.
Le test t, l’analyse unidirectionnelle de la variance (ANOVA) et une forme d’analyse de régression sont mathématiquement équivalents (voir l’analyse statistique du plan expérimental randomisé uniquement après le test) et produiraient des résultats identiques.