La prueba T
La prueba t evalúa si las medias de dos grupos son estadísticamente diferentes entre sí. Este análisis es apropiado siempre que desee comparar las medias de dos grupos, y especialmente apropiado como análisis para el diseño experimental aleatorio de dos grupos después de la prueba.
la Figura 1. Distribuciones idealizadas para los valores posteriores a la prueba tratados y de grupo de comparación.
La figura 1 muestra las distribuciones para los grupos tratados (azul) y de control (verde) en un estudio. En realidad, la figura muestra la distribución idealizada: la distribución real generalmente se representaría con un histograma o gráfico de barras. La figura indica dónde se encuentran los medios del grupo de control y tratamiento. La pregunta que aborda la prueba t es si las medias son estadísticamente diferentes.
¿Qué significa decir que los promedios de dos grupos son estadísticamente diferentes? Considere las tres situaciones que se muestran en la Figura 2. Lo primero que hay que notar sobre las tres situaciones es que la diferencia entre las medias es la misma en las tres. Pero, también debe notar que las tres situaciones no se ven iguales, cuentan historias muy diferentes. El ejemplo superior muestra un caso con variabilidad moderada de las puntuaciones dentro de cada grupo. La segunda situación muestra el caso de alta variabilidad. el tercero muestra el caso con baja variabilidad. Claramente, concluiríamos que los dos grupos parecen más diferentes o distintos en el caso inferior o de baja variabilidad. ¿Por qué? Porque hay relativamente poca superposición entre las dos curvas en forma de campana. En el caso de la alta variabilidad, la diferencia de grupo parece menos llamativa porque las dos distribuciones en forma de campana se superponen mucho.
la Figura 2. Tres escenarios para diferencias entre medios.
Esto nos lleva a una conclusión muy importante: cuando observamos las diferencias entre las puntuaciones de dos grupos, tenemos que juzgar la diferencia entre sus medias en relación con la propagación o variabilidad de sus puntuaciones. La prueba t hace exactamente esto.
Análisis estadístico de la prueba t
La fórmula para la prueba t es una relación. La parte superior de la relación es solo la diferencia entre las dos medias o promedios. La parte inferior es una medida de la variabilidad o dispersión de las puntuaciones. Esta fórmula es esencialmente otro ejemplo de la metáfora de señal a ruido en la investigación: la diferencia entre las medias es la señal que, en este caso, creemos que nuestro programa o tratamiento introdujo en los datos; la parte inferior de la fórmula es una medida de variabilidad que es esencialmente ruido que puede hacer más difícil ver la diferencia de grupo. La Figura 3 muestra la fórmula para la prueba t y cómo se relacionan el numerador y el denominador con las distribuciones.
la Figura 3. Fórmula para la prueba t.
La parte superior de la fórmula es fácil de calcular, simplemente encuentre la diferencia entre las medias. La parte inferior se llama el error estándar de la diferencia. Para calcularlo, tomamos la varianza para cada grupo y la dividimos por el número de personas en ese grupo. Agregamos estos dos valores y luego tomamos su raíz cuadrada. La fórmula específica para el error estándar de la diferencia entre las medias es:
$$\textrm{SE}(\bar{X}_T-\bar{X}_C) = \sqrt{\frac{\textrm{var}_T}{n_T}+\frac{\textrm{var}_C}{n_C}}$$
Recuerde, que la varianza es simplemente el cuadrado de la desviación estándar.
La fórmula final de la prueba de t es:
$$t = \frac{\bar{X}_T-\bar{X}_C}{\sqrt{\frac{\textrm{var}_T}{n_T}+\frac{\textrm{var}_C}{n_C}}}$$
El t
valor será positivo si la primera media es mayor que el segundo y negativo si es menor. Una vez que calcule el valor t
, debe buscarlo en una tabla de importancia para probar si la relación es lo suficientemente grande como para decir que la diferencia entre los grupos no es probable que haya sido un hallazgo casual. Para probar la importancia, debe establecer un nivel de riesgo (llamado nivel alfa). En la mayoría de las investigaciones sociales, la «regla empírica»es establecer el nivel alfa en .05
. Esto significa que cinco de cada cien veces encontrarías una diferencia estadísticamente significativa entre las medias incluso si no hubiera ninguna (es decir, por «casualidad»). También es necesario determinar los grados de libertad (df) para la prueba. En el t-test
, los grados de libertad son la suma de las personas en ambos grupos menos 2
. Dado el nivel alfa, el df y el valor t
, puede buscar el valor t
en una tabla de significación estándar (disponible como apéndice en la parte posterior de la mayoría de los textos estadísticos) para determinar si el valor t
es lo suficientemente grande como para ser significativo. Si lo es, puede concluir que la diferencia entre las medias para los dos grupos es diferente (incluso dada la variabilidad). Afortunadamente, los programas estadísticos de computadora imprimen rutinariamente los resultados de las pruebas de significación y le ahorran la molestia de buscarlos en una tabla.
La prueba t, el Análisis de Varianza unidireccional (ANOVA) y una forma de análisis de regresión son matemáticamente equivalentes (ver el análisis estadístico del diseño experimental aleatorio solo posterior a la prueba) y producirían resultados idénticos.