Prueba t
La prueba t es un procedimiento estadístico que comprueba si existe una diferencia significativa entre las medias de dos grupos.
Los dos grupos podrían ser, por ejemplo, pacientes que recibieron el fármaco A una vez y el fármaco B otra vez, y quieres saber si hay una diferencia en la tensión arterial entre estos dos grupos.
Tipos de prueba t
Hay tres tipos diferentes de pruebas t. La prueba t de una muestra, la prueba t para muestras independientes y la prueba t para muestras relacionadas.
Prueba t de una muestra
¿Cuándo utilizamos la prueba t de una muestra? Utilizamos la prueba t de una muestra cuando queremos comparar la media de una muestra con una media de referencia conocida.
Ejemplo de prueba t de una muestra
Un fabricante de tabletas de chocolate afirma que sus tabletas de chocolate pesan 50 gramos de media. Para comprobarlo, se toma una muestra de 30 tabletas y se pesan. El valor medio de esta muestra es de 48 gramos.
Ahora podemos realizar una prueba t de una muestra para ver si la media de 48 gramos es significativamente diferente de los 50 gramos declarados.
Prueba t para muestras independientes
¿Cuándo utilizar la prueba t para muestras independientes? Utilizamos la prueba t para muestras independientes cuando queremos comparar las medias de dos grupos o muestras independientes. Queremos saber si hay una diferencia significativa entre esas medias.
Ejemplo de prueba t para muestras independientes
Queremos comparar la eficacia de dos analgésicos, el fármaco A y el fármaco B.
Para ello, dividimos aleatoriamente a 60 sujetos de prueba en dos grupos. El primer grupo recibe el fármaco A, el segundo grupo recibe el fármaco B. Con una prueba t independiente podemos comprobar si existe una diferencia significativa en el alivio del dolor entre los dos fármacos.
Prueba t para muestras relacionadas
¿Cuándo utilizar la prueba t para muestras relacionadas (prueba t pareada)? La prueba t para muestras relacionadas, también conocida como de muestras dependientes, se utiliza para comparar las medias de dos grupos dependientes.
Ejemplo de la prueba t para muestras relacionadas
Queremos saber la eficacia de una dieta. Para ello, pesamos a 30 personas antes de la dieta y exactamente a las mismas personas después de la dieta.
Ahora podemos ver para cada persona cuán grande es la diferencia de peso entre antes y después. Con una prueba t dependiente podemos comprobar ahora si hay una diferencia significativa.
Muestra pareada frente a muestra no pareada
En una muestra pareada (muestra dependiente) los valores medidos están disponibles por pares. Los pares se crean, por ejemplo, mediante mediciones repetidas en las mismas personas. Las muestras independientes (muestra no pareada) son el resultado de personas y mediciones independientes entre sí.
Un consejo
La prueba t para muestras dependientes es muy similar a la prueba t para una muestra. También podemos pensar en la prueba t para muestras dependientes como si tuviéramos una muestra que se midió en dos momentos distintos. Como se muestra a continuación, calculamos la diferencia entre los valores emparejados y obtenemos un valor para una muestra.
Una vez obtenemos -5, otra +2, otra -1 y así sucesivamente. Ahora queremos comprobar si la media de las diferencias que acabamos de calcular se desvía de un valor de referencia. En este caso, cero. Y eso es exactamente lo que hace la prueba t para una muestra.
Supuestos
¿Cuáles son los requisitos para poder calcular una prueba t en primer lugar? En primer lugar, por supuesto, debemos tener una muestra adecuada.
- Para la prueba t de una muestra necesitamos una muestra y un valor de referencia.
- En una prueba t independiente, necesitamos dos muestras independientes.
- Y con la prueba t pareada, necesitamos una muestra dependiente.
La variable para la que se va a probar si hay diferencia entre las medias debe ser métrica. Las variables métricas son, por ejemplo, la edad, el peso corporal o los ingresos. Una variable no métrica es, por ejemplo, la titulación escolar de una persona (Educación Secundaria, Bachillerato...).
Además, la variable métrica debe distribuirse normalmente en las tres variantes de la prueba t.
Puedes averiguar cómo comprobar si tus datos se distribuyen normalmente en el tutorial sobre la comprobación de la distribución normal.
Para la prueba t dependiente, las varianzas de los dos grupos deben ser aproximadamente iguales. Puedes comprobar si las varianzas son iguales con la prueba de Levene.
Hipótesis
¿Cuáles son las hipótesis de la prueba t? Empecemos por la prueba t para una muestra.
Prueba t para una muestra
En la prueba t para una muestra, la hipótesis nula y la hipótesis alternativa son:
- Hipótesis nula: La media muestral es igual al valor de referencia dado (por lo que no hay diferencia).
- Hipótesis alternativa: La media de la muestra no es igual al valor de referencia dado (por lo que hay una diferencia).
Prueba t para muestras independientes
¿Qué ocurre con la prueba t para muestras independientes? En la prueba t para muestras independientes, las hipótesis son:
- Hipótesis nula: Las medias de los dos grupos son iguales (por tanto, no hay diferencia entre los dos grupos).
- Hipótesis alternativa: Las medias de los dos grupos no son iguales (es decir, hay una diferencia entre los dos grupos).
Prueba t para muestras pareadas
Y, por último, la prueba t para muestras pareadas. En la prueba t para muestras emparejadas, las hipótesis son:
- Hipótesis nula: La media de la diferencias entre los pares es cero.
- Hipótesis alternativa: La media de la diferencias entre los pares es distinta de cero.
¿Por qué necesitamos una prueba t?
Supongamos que hemos formulado una hipótesis:
Existe una diferencia en la duración de los estudios entre hombres y mujeres en Alemania.
Por tanto, nuestra población de base son todos los titulados superiores en Alemania. Como, evidentemente, no podemos encuestar a todos los titulados, extraemos una muestra lo más representativa posible.
Con la prueba t comprobamos ahora la hipótesis nula de que no hay diferencias en la población.
Si no hay diferencia en la población, entonces seguramente seguiremos viendo una diferencia en la duración de los estudios en la muestra. Sería muy improbable que extrajéramos una muestra en la que la diferencia fuera exactamente cero.
En términos sencillos, ahora queremos saber a partir de qué diferencia, medida en la muestra, podemos decir que la duración de los estudios de hombres y mujeres es significativamente diferente. Y esto es exactamente lo que responde la prueba t.
Calcular la prueba t
¿Cómo se calcula una prueba t? Primero se necesita el valor t:
Para calcular el valor t, necesitamos dos valores. En primer lugar, necesitamos la diferencia de las medias y, en segundo lugar, la desviación típica de la media. Este valor se denomina error típico.
En la prueba t muestral, calculamos la diferencia entre la media muestral y la media de referencia conocida. s es la desviación típica de los datos recogidos y n es el número de casos.
s dividido por la raíz cuadrada de n es entonces la desviación típica de la media o el error típico.
En la Prueba t para muestras independientes, la diferencia se calcula simplemente a partir de la diferencia de las dos medias muestrales.
Para calcular el error típico, necesitamos la desviación típica y el número de casos de la primera y la segunda muestra.
Dependiendo de si podemos suponer varianzas iguales o desiguales para nuestros datos, existen diferentes fórmulas para el error típico. Más información en el tutorial sobre la prueba t para muestras independientes.
Con una prueba t para muestras relacionadas, sólo tenemos que calcular la diferencia de los valores emparejados y calcular la media a partir de ella. El error típico es entonces el mismo que en la prueba t para una muestra.
Interpretar el valor t
Independientemente de la prueba t que calculemos, el valor t se hace mayor cuanto mayor es la diferencia entre las medias. Del mismo modo, el valor t se hace menor cuando la diferencia entre las medias es menor.
Asímismo, el valor t se hace menor si tenemos una mayor dispersión de los valores medios. Por tanto, cuanto mayor sea la dispersión de los datos, menos importará una diferencia de medias
El valor t y la hipótesis nula
Ahora queremos utilizar la prueba t para averiguar si rechazamos o no la hipótesis nula. Para ello, podemos utilizar el valor t de dos formas. Bien leemos el llamado valor t crítico de una tabla, o calculamos simplemente el valor p con ayuda del valor t.
Empecemos por el método del valor t crítico, que podemos leer de una tabla. Para ello, primero necesitamos la tabla de valores t críticos, que podemos encontrar en datatab.net, dentro de "Tutoriales" y en "distribución t". Empecemos primero con el caso de dos colas, que es una hipótesis unilateral o dirigida. A continuación vemos la tabla.
Primero tenemos que determinar qué nivel de significación queremos utilizar. Aquí elegimos un nivel de significación de 0.05, es decir, del 5%. Luego tenemos que mirar en la columna a 1-0.05, es decir, 0.95.
Ahora necesitamos los grados de libertad. En la prueba t de una muestra y en la prueba t de muestras dependientes, los grados de libertad son simplemente el número de casos menos 1. Por tanto, si tenemos una muestra de 10 personas, tenemos 9 grados de libertad. En la prueba t de muestras independientes, sumamos el número de personas de las dos muestras y calculamos menos 2 porque tenemos dos muestras. Hay que tener en cuenta que los grados de libertad también pueden determinarse de otras formas, dependiendo de si se supone una varianza igual o desigual.
Así, si tenemos un nivel de significación del 5% y 9 grados de libertad, obtenemos un valor t crítico de 2.262.
Por un lado, hemos calculado un valor t con la prueba t, y luego tenemos el valor t crítico. Si el valor t calculado es mayor que el valor t crítico, rechazamos la hipótesis nula. Supongamos que hemos calculado un valor t de 2.5. Este valor es mayor que 2.262 y, por tanto, las dos medias están tan alejadas que podemos rechazar la hipótesis nula.
Por otro lado, también podemos calcular el valor p para el valor t que hemos calculado. Si introducimos en el recuadro marcado en verde 2.5 para el valor t y 9 para los grados de libertad, obtenemos un valor p de 0.034. El valor p es inferior a 0.05, por lo que también rechazamos la hipótesis nula de esta forma.
Como comprobación, si introducimos el valor t de 2.262, obtenemos exactamente un valor p de 0.05, que es exactamente el límite.
Calcular la prueba t con DATAtab
Si quieres calcular una prueba t con DATAtab, todo lo que tienes que hacer es copiar tus propios datos en la tabla, hacer clic en "Prueba de Hipótesis" y luego seleccionar las variables deseadas.
Por ejemplo, si quieres comprobar si el sexo influye en los ingresos, simplemente haz clic en ambas variables y se calculará automáticamente una prueba t para muestras independientes. A continuación, puedes leer el valor p en la parte inferior.
Si aún no estás seguro de cómo interpretar los resultados, sólo tienes que hacer clic en "Interpretación en palabras":
Hipótesis dirigida y no dirigida
La última cuestión que se plantea ahora es cuál es la diferencia entre una hipótesis de una cola o dirigida y una hipótesis de dos colas o no dirigida. En el caso no dirigido, la hipótesis alternativa es que existe una diferencia entre, por ejemplo, el salario de los hombres y el de las mujeres.
En este caso, no nos interesa saber cuál de las dos opciones gana más, sólo queremos saber si hay diferencia o no. Con una hipótesis dirigida, también nos interesa la dirección de la diferencia. Entonces, la hipótesis alternativa es, por ejemplo, que los hombres ganan más que las mujeres o que las mujeres ganan más que los hombres.
Si observamos esto gráficamente con la distribución t, vemos que en el caso de dos colas tenemos un rango a la izquierda y otro a la derecha. Queremos rechazar la hipótesis nula si estamos en uno u otro rango. A un nivel de significación del 5%, ambos rangos tienen una probabilidad del 2.5%, por lo que juntos tienen un 5%.
Cuando hacemos una prueba t unilateral, sólo rechazamos la hipótesis nula si estamos en ese rango, siempre en función del signo (el lado o cola) que estemos probando. En ese caso, con un nivel de significación del 5%, todo el 5% queda dentro de este rango.