Prueba t de una muestra
La prueba t es una de las pruebas de hipótesis más habituales en estadística. La prueba t determina si la media muestral y la media de la población difieren o si dos medias muestrales difieren estadísticamente. La prueba t distingue entre:
- prueba t de una muestra
- prueba t de muestras independientes
- prueba t de muestra dependiente
La elección de qué prueba t utilizar depende de si se dispone de una o dos muestras. Si se dispone de dos muestras, se distingue entre muestras dependientes e independientes. En este tutorial encontrarás todo sobre la prueba t de una muestra.
Consejo: ¿Quieres calcular el valor t? Puedes calcularlo fácilmente para las tres pruebas t en línea en la calculadora de pruebas t de DATAtab
La prueba t de una muestra se utiliza para comprobar si la población difiere de un valor fijo. Por tanto, la pregunta es: ¿Existen diferencias estadísticamente significativas entre la media de una muestra y el valor fijado? El valor fijado puede reflejar, por ejemplo, el porcentaje de población restante o un objetivo de calidad que se quiere controlar.
Ejemplo de ciencias sociales:
Quieres averiguar si la percepción de la salud de los directivos en Canadá difiere de la del conjunto de la población. Para ello, preguntas a 50 directivos sobre su percepción de la salud.
Ejemplo técnico:
Quieres averiguar si los tornillos que produce tu empresa pesan realmente 10 gramos de media. Para comprobarlo, pesas 50 tornillos y comparas el peso real con el peso que deberían tener (10 gramos).
Ejemplo médico:
Una empresa farmacéutica promete que su nuevo medicamento reduce la tensión arterial 10 mmHg en una semana. Quieres averiguar si esto es correcto. Para ello, comparas la reducción observada en la tensión arterial de 75 sujetos de prueba con la reducción esperada de 10 mmHg.
Suposiciones
En una prueba t de una muestra, los datos considerados deben proceder de una muestra aleatoria, tener escala métrica de medida y una distribución normal.
Pruebas t unilaterales (una cola) y bilaterales (dos colas)
Por tanto, si quieres saber si una muestra difiere de la población, tienes que calcular una prueba t de una muestra. Sin embargo, antes de calcular la prueba t, hay que definir una pregunta y las hipótesis. Esto determina si hay que calcular una prueba t de una cola (unilaterales) o de dos colas (bilaterales).
La pregunta te ayuda a definir el objeto de investigación. En el caso de la prueba t de una muestra, la pregunta es:
Bilaterales
¿Existe una diferencia estadísticamente significativa entre el valor medio de la muestra y el de la población?
Unilaterales
¿Es el valor medio de la muestra significativamente mayor (o menor) que el valor medio de la población?
Para los ejemplos anteriores, esto nos proporciona las siguientes preguntas
- ¿Difiere la percepción de la salud de los directivos de Canadá de la de la población general de Canadá?
- ¿Produce la planta de producción tornillos con un peso de 10 gramos?
- ¿Reduce el nuevo medicamento la tensión arterial 10 mmHg en una semana?
Prueba t de hipótesis
Para realizar una prueba t de una muestra, se formulan las siguientes hipótesis:
De dos colas (no direccional)
- Hipótesis nula H0: El valor medio de la población es igual al valor especificado.
- Hipótesis alternativa H1: El valor medio de la población no es igual al valor especificado.
De una cola (direccional)
- Hipótesis nula H0: El valor medio de la población es igual o mayor (o menor) que el valor especificado.
- Hipótesis alternativa H1: El valor medio de la población es menor (o mayor) que los valores especificados.
Fórmula de la prueba t de una muestra
Puedes calcular la prueba t con un programa estadístico como DATAtab o a mano. Para el cálculo a mano necesitas primero el estadístico de prueba t, que se puede calcular para la prueba t de una muestra con la fórmula
Para comprobar si el valor medio de la muestra difiere significativamente del de la población, hay que calcular el valor t crítico. Primero se necesita el número de grados de libertad, abreviado del inglés df, que se calcula tomando el número de muestras menos uno.
donde la desviación típica es la de la población estimada con la muestra.
Si se conoce el número de grados de libertad, se puede determinar el valor t crítico utilizando la tabla de valores t. Para una muestra de 12 personas, el grado de libertad es 11, y se supone que el nivel de significación es del 5 %. La tabla siguiente muestra los valores t para una distribución abierta de una cola. Dependiendo de si quieres calcular una prueba t de una cola (direccional) o de dos colas (no direccional), debes leer el valor t para el área 0.95 o para el área 0.975. Para la hipótesis no direccional y un nivel de significación del 5%, el valor t crítico es 2.201.
Si el valor t calculado está por debajo del valor t crítico, no hay diferencia significativa entre la muestra y la población; si está por encima del valor t crítico, hay una diferencia significativa.
Área de una cola | |||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
Grado de libertad | |||||||||||
... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... |
9 | |||||||||||
10 | |||||||||||
11 | |||||||||||
12 | |||||||||||
13 | |||||||||||
... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... |
Interpretación del valor t
El valor t se calcula dividiendo la diferencia medida por la dispersión en los datos de la muestra. Cuanto mayor sea la magnitud de t, más se argumenta en contra de la hipótesis nula. Si el valor t calculado es mayor que el valor t crítico, se rechaza la hipótesis nula.
Número de grados de libertad - df
El número de grados de libertad indica cuántos valores pueden variar libremente. Los grados de libertad son, por tanto, el número de datos individuales independientes.
Ejemplo de prueba t de una muestra
Como ejemplo de la prueba t para una muestra, examinamos si un tutorial de estadística online recién introducido en la universidad tiene algún efecto sobre los resultados de los exámenes de los alumnos.
La nota media en el examen de estadística de una universidad ha sido de 28 puntos durante años. Este semestre se ha introducido un nuevo tutorial online de estadística y ahora la dirección del curso quiere saber si el éxito de los estudios ha cambiado desde dicha introducción: ¿Tiene el tutorial online de estadística un efecto positivo en los resultados de los exámenes?
La población considerada son todos los alumnos que han realizado el examen de estadística desde que se introdujo el nuevo tutorial. El valor de referencia que se va a comparar es 28.
Hipótesis nula H0
El valor medio de la muestra y el valor predefinido no difieren significativamente. El tutorial online de estadística no tiene un efecto significativo en los resultados del examen.
Alumno | Puntuación |
---|---|
1 | 28 |
2 | 29 |
3 | 35 |
4 | 37 |
5 | 32 |
6 | 26 |
7 | 37 |
8 | 39 |
9 | 22 |
10 | 29 |
11 | 36 |
12 | 38 |
Así se hace en DATAtab:
¿Quieres calcular una prueba t de forma independiente? Calcula el ejemplo en la calculadora estadística. Sólo tienes que copiar la tabla superior, incluida la primera fila, en la Calculadora de la prueba t . Datatab te proporcionará entonces las tablas inferiores.
Los siguientes resultados se obtienen con DATAtab: El valor medio es 32.33 y la desviación típica 5.46. Esto conduce a un error típico del valor medio de 1.57. Por tanto, el estadístico t da 2.75.
Ahora quieres saber si tu hipótesis (la puntuación es 28) es significativa o no. Para ello, primero especifica un nivel de significación en Datatab, normalmente se utiliza el 5%, que está preseleccionado. Ahora obtendrás la siguiente tabla.
Estadísticos
n | Valor medio | Desviación típica | Error típico del valor medio | |
---|---|---|---|---|
Puntuación | 12 | 32.33 | 5.47 | 1.58 |
Prueba t de una muestra (Valor de la prueba = 28)
t | df | p | |
---|---|---|---|
Puntuación | 2.75 | 11 | 0.02 |
Intervalo de confianza del 95% de la diferencia
Valor medio de la diferencia | Inferior | Superior | |
---|---|---|---|
Puntuación | 4.33 | 0.86 | 7.81 |
Para interpretar si tu hipótesis es significativa puedes utilizar uno de los dos valores
- valor p (2 colas)
- intervalo de confianza inferior y superior de la diferencia
En este ejemplo, el valor p (2 colas) es igual a 0.02 , es decir, el 2%. En otras palabras, la probabilidad de que se extraiga de la población una muestra con una diferencia media igual o superior a 4.33 es del 2%. El nivel de significación se fijó en el 5%, que es superior al 2%. Por ello, se supone una diferencia significativa entre la muestra y la población.
La existencia o no de una diferencia significativa también puede leerse en el intervalo de confianza de la diferencia. Si los límites inferior y superior llegan a cero, no hay diferencia significativa. Si no es así, hay una diferencia significativa. En este ejemplo, el valor inferior es 0.86 y el superior 7.81. Como los valores inferior y superior no tocan el cero, hay una diferencia significativa.
Estilo APA | Prueba t de una muestra
Si escribiéramos los resultados superiores para publicarlos en una revista APA, es decir, en formato APA, lo escribiríamos así:
Una prueba t mostró una diferencia estadísticamente fiable entre la puntuación de los alumnos que asistieron al curso online y la puntuación media de los alumnos que no asistieron a un curso online. (M = 32.33, s = 5.47) y 28, t(11) = 2.75, p < 0.02, α = 0.05.