Menu

¿Qué es el valor p?

El valor p indica la probabilidad de que se produzca el resultado observado o un resultado aún más extremo si la hipótesis nula es cierta.

El valor p se utiliza para decidir si la hipótesis nula se rechaza o se mantiene (no se rechaza). Si el valor p es menor que el nivel de significación definido (a menudo el 5%), se rechaza la hipótesis nula, de lo contrario no.

Quieres hacer una afirmación sobre la población y has establecido una hipótesis para ello. Como normalmente no es posible realizar la encuesta a toda la población, se la haces a una muestra. Ahora bien, lo más probable es que esta muestra, debido al azar, se desvíe de la población.

p-valor población muestra

Si la hipótesis nula se aplica en tu población, por ejemplo que el salario de hombres y mujeres no difiere en Alemania, entonces seguramente seguirá habiendo una diferencia en la muestra, por ejemplo una diferencia de 300 euros al mes. Ahora el valor p te indica la probabilidad de que una diferencia de 300 euros o más se produzca por azar en la muestra si no hay diferencia en la población.

Si el resultado es una probabilidad muy pequeña, puedes preguntarte si la hipótesis sobre la población es cierta.

Si el valor p es del 3%, por ejemplo, entonces sólo es un 3% probable que se extraiga una muestra en la que los salarios de hombres y mujeres difieran en más de 300 euros.

¿Cuándo se utiliza el valor p?

El valor p se utiliza para rechazar o mantener (no rechazar) la hipótesis nula en una prueba de hipótesis. Si el valor p calculado es menor que el nivel de significación, que en la mayoría de los casos es del 5%, se rechaza la hipótesis nula; en caso contrario, se mantiene.

Valor p

Ejemplo:

  • La hipótesis nula es que no hay diferencia entre los salarios de hombres y mujeres.
  • Ahora se toma una muestra con los salarios de hombres y mujeres. Estos son nuestros resultados observados.
  • Suponemos que la hipótesis nula es cierta, es decir, que no hay diferencia entre los salarios de hombres y mujeres.
  • En el resultado observado (muestra) descubrimos ahora que los hombres ganan 150 € más al mes que las mujeres.
  • El valor p indica ahora la probabilidad de extraer una muestra en la que el salario de hombres y mujeres difiera en 150 € o más, aunque no haya diferencias en la población.
  • Si el valor p es, por ejemplo, 0.04 , sólo es un 4% probable extraer una muestra de 150€ o más extrema, si no hay diferencia de salario en la población.

Digamos que en el caso superior sale un valor p de 0.04 o 4%, ¿qué significa ahora este valor p? Significa que si no hay diferencia de salario en la población, sólo hay un 4% de probabilidades de extraer una muestra de 150€ o más extrema.

La probabilidad del 4% es, por supuesto, muy baja, por lo que cabe preguntarse si es cierto en absoluto que los hombres y las mujeres de la población ganan lo mismo o si más bien hay que rechazar esta hipótesis.

La pregunta a partir de cuándo se descarta la hipótesis nula responde al nivel de significación.

Nivel de significación

El nivel de significación se determina antes de la prueba. Si el valor p calculado está por debajo de este valor, se rechaza la hipótesis nula, de lo contrario se mantiene. Por regla general, se elige un nivel de significación del 5%.

  • α < 0.01 : resultado muy significativo.
  • α < 0.05 : resultado significativo.
  • α > 0.05 : resultado no significativo.

El nivel de significación indica, por tanto, la probabilidad de un error de tipo 1. ¿Qué significa esto? Si hay un valor p del 5% y se rechaza la hipótesis nula, la probabilidad de que la hipótesis nula sea válida es del 5%, es decir, hay un 5% de probabilidad de cometer un error. Si el valor crítico se reduce al 1%, la probabilidad de error es, en consecuencia, sólo del 1%, pero también es más difícil confirmar la hipótesis alternativa.

Valores p de una cola

Supongamos que estás examinando el tiempo de reacción de dos grupos. Entonces, a menudo no interesa saber si hay una diferencia entre los dos grupos, sino si un grupo tiene un valor mayor o menor que el otro. En este caso, tendrías una hipótesis dirigida y luego calcularías lo que se denomina un valor p unilateral.

Un valor p de una cola incluye valores más extremos que el resultado obtenido en una dirección, habiéndose establecido dicha dirección de antemano.

Un valor p de dos colas incluye valores más extremos tanto en sentido positivo como negativo.

El valor p unilateral se obtiene dividiendo el valor p bilateral por 2. En este caso, por supuesto, hay que tener cuidado de que la diferencia o el efecto considerado esté en la dirección de la hipótesis alternativa.

Ejemplo

Tu hipótesis alternativa es que el grupo A tiene mayores valores de tiempo de reacción que el grupo B. Al analizar tus datos obtienes un valor p de dos caras de 0.04.

Ahora tienes que comprobar si el grupo A tiene realmente valores mayores en tus datos. Si es así, el valor p de dos caras se divide por dos, por lo que obtienes 0.02.

Si no es así y el efecto o la diferencia va exactamente en la dirección opuesta a la formulada en la hipótesis alternativa, tu valor p es 1-0.02, es decir, 0.98.

No te preocupes, si utilizas DATAtab, puedes especificar qué tipo de hipótesis tienes, y DATAtab te ayudará a evaluarla.

Calcular el valor p

Para calcular el valor p, primero hay que encontrar una prueba de hipótesis adecuada. Si se encuentra la prueba de hipótesis adecuada, puedes calcular el valor p en la calculadora estadística de DATAtab. Las pruebas de hipótesis más conocidas son

Para calcular el valor p se necesita una función de distribución que describa las realizaciones o extracciones de la muestra. Si se conoce esta función de distribución, se puede determinar la probabilidad de que una muestra extraída sea menor o igual que un valor considerado. Los representantes clásicos de estas distribuciones son la distribución t y la distribución Chi-cuadrado.

Pruebas estadísticas y el valor p

Para rechazar o mantener una hipótesis se necesita el valor p. El procedimiento para utilizar el valor p en las pruebas estadísticas es el siguiente:

  • Definición del valor p crítico o del nivel de significación por ejemplo, 5%.
  • Definición de un procedimiento de prueba estadística por ejemplo pruebas t o análisis de correlación
  • Cálculo de los estadísticos de la prueba a partir de la muestra por ejemplo, el valor t en la prueba t
  • Determinación del valor p para los estadísticos de la prueba por ejemplo valor p para una t dada en la prueba t
  • Comprobación de si el valor p está por encima o por debajo del valor p crítico especificado por ejemplo el valor p 1% se escapa por debajo del valor crítico del 5%

Cita DATAtab: DATAtab Team (2024). DATAtab: Online Statistics Calculator. DATAtab e.U. Graz, Austria. URL https://datatab.es

Contacto y soporte Preguntas frecuentes y Sobre nosotros Política de privacidad Software estadístico