Menu

Prueba de Kruskal-Wallis

Qué es la prueba de Kruskal-Wallis

La prueba de Kruskal-Wallis (prueba H) es una prueba de hipótesis para muestras múltiples independientes, que se utiliza cuando no se cumplen los supuestos de un análisis de varianza de un factor.

Dado que la prueba de Kruskal-Wallis es una prueba no paramétrica (también denominada prueba sin distribución), no es necesario, a diferencia de en el análisis de la varianza, que los datos utilizados se distribuyan normalmente. El único requisito es que los datos sean de escala ordinal.

Kruskal-Wallis-Test vs ANOVA

En la prueba de Kruskal-Wallis, las variables ordinales son suficientes, ya que las pruebas no paramétricas no utilizan las diferencias de los valores, sino los rangos (qué valor es mayor, cuál es menor). Por tanto, la prueba de Kruskal-Wallis también suele denominarse "prueba ANOVA unidireccional por rangos de Kruskal-Wallis".

Ejemplos de la prueba de Kruskal-Wallis

Por supuesto que se pueden utilizar los mismos ejemplos para la prueba de Kruskal-Wallis que para el análisis de varianza de un solo factor; añadiendo que los datos no tienen por qué estar distribuidos normalmente.

Ejemplo médico:

En una empresa farmacéutica se quiere comprobar si un fármaco XY influye en el peso corporal. Para ello, se administra el fármaco a 20 personas del estudio, 20 personas reciben un placebo y 20 personas no reciben ningún fármaco ni placebo.

Ejemplo de ciencias sociales:

¿Difieren 3 grupos de edad en cuanto al consumo diario de televisión?

Pregunta de investigación e hipótesis

La pregunta de investigación para la prueba de Kruskal-Wallis puede ser: ¿Existe alguna diferencia en la tendencia central de varias muestras independientes? Esta pregunta da lugar a las hipótesis nula y alternativa.

Hipótesis nula

Las muestras independientes tienen todas la misma tendencia central y, por tanto, proceden de la misma población.

Hipótesis alternativa

Al menos una de las muestras independientes no tiene la misma tendencia central que las demás muestras y, por tanto, procede de una población diferente.

Mediana frente a sumas de rango

En realidad, la prueba de Kruskal-Wallis comprueba las diferencias en las sumas de rangos de los grupos, no directamente las medianas. Esta distinción es importante y debe quedar clara:

Sumas de rangos

En la prueba de Kruskal-Wallis, se suman todos los datos de todos los grupos. Cada valor se sustituye por su rango en el conjunto de datos combinados. A continuación, la prueba suma estos rangos para cada grupo. La hipótesis nula de la prueba de Kruskal-Wallis es que el rango medio de los grupos es el mismo. Esto es diferente de decir que las medianas son iguales, aunque existe una relación entre ambas.

Mediana

Aunque la prueba se utiliza a menudo como indicador de diferencias en las medianas (especialmente cuando las distribuciones son similares), en sentido estricto las medianas no se prueban directamente. La razón es que con distribuciones similares, las diferencias en las medias también implican diferencias en las medianas.

Resumen

En resumen, la prueba de Kruskal-Wallis es un método no paramétrico para comprobar si las muestras proceden de la misma distribución. Comprueba si los rangos medios de los grupos son iguales, lo que a menudo se interpreta como una prueba de diferencias en las medianas, especialmente cuando las formas de distribución de los grupos son similares.

Supuestos para la prueba de Kruskal-Wallis

Para calcular una prueba de Kruskal-Wallis, sólo se debe disponer de varias muestras aleatorias independientes con características de, al menos, escala ordinal. Las variables no tienen que satisfacer una curva de distribución.

Assumptions Kruskal-Wallis-Test

Si tienes una muestra dependiente, entonces sólo tienes que utilizar la prueba de Friedman.

Calcular la prueba de Kruskal-Wallis

El cálculo del análisis de varianza de rangos de Kruskal y Wallis es similar al de la prueba U de Mann-Whitney, que es la contrapartida no paramétrica de la prueba t para muestras independientes.

Supongamos que la hipótesis nula es cierta y, por tanto, no hay diferencia entre las muestras independientes. Entonces, los rangos altos y bajos se distribuyen aleatoriamente entre las muestras y deberían distribuirse por igual entre los grupos. Por tanto, la probabilidad de que se asigne un rango a un grupo es la misma para todos los grupos.

Si no hay diferencias entre los grupos, el valor medio de los rangos también debería ser el mismo en todos los grupos. El valor esperado de los rangos para cada grupo viene dado entonces por

Kruskal-Wallis-Test Expected value

Cada muestra tiene el mismo valor esperado de los rangos, que corresponde al valor esperado de la población. Además, se necesita la varianza de los rangos, que se puede calcular con la siguiente fórmula:

Kruskal-Wallis-Test Variance

En la prueba de Kruskal-Wallis, se calcula la variable de prueba H. El valor H corresponde al valor χ2. El valor H resulta de:

Calculate Kruskal-Wallis-Test

El valor H crítico puede leerse en la tabla de valores χ2 críticos.

Cálculo con datos de ejemplo

Supongamos que has medido el tiempo de reacción de tres grupos y quieres saber si hay alguna diferencia entre ellos. Para averiguarlo, utilizas la prueba H (prueba de Kruskal-Wallis)

Primero asignamos un rango a cada persona, luego calculamos la suma de rangos y la suma media de rangos.

Calculate Kruskal-Wallis test

Medimos el tiempo de reacción en doce personas, por lo que el número de casos es doce. Los grados de libertad vienen dados por el número de grupos menos uno, por lo que tenemos dos grados de libertad.

Kruskal-Wallis-Test

Ahora hemos calculado todos los valores para calcular la cantidad de prueba H.

H test and the test statistic H

Una vez calculado el valor H o el valor chi-cuadrado, se puede leer el valor chi-cuadrado crítico en la tabla de valores chi-cuadrado críticos.

Kruskal-Wallis-Test critical H value

Con un nivel de significación del 5%, el valor crítico de chi-cuadrado resulta 5.991. Este valor crítico es, por tanto, mayor que el valor de chi-cuadrado o H calculado. Así pues, se mantiene la hipótesis nula y no hay diferencias en el tiempo de reacción en los tres grupos.

Prueba post-hoc

La prueba de Kruskal-Wallis puede utilizarse para determinar si al menos dos grupos difieren entre sí. La prueba de Kruskal-Wallis no proporciona una respuesta a la pregunta de cuál de los grupos difiere; para ello se requiere una prueba post-hoc.

La prueba de Dunn es la prueba no paramétrica adecuada para la comparación múltiple por pares.

Pruebas de Dunn-Bonferroni

Para averiguar cuáles de los pares difieren, los grupos individuales pueden compararse por pares. La prueba de Dunn se utiliza para calcular el valor p de cada par. Para comparar los grupos A y B, se calcula el valor z mediante la siguiente fórmula.

Dunn-Bonferroni-Tests

donde i es uno de los grupos y yi= WA-WB es la diferencia de las sumas medias de los rangos. El error típico viene dado por

Dunn’s test

Donde N es el número de todos los casos, r es el número de rangos conectados y τs es el número de casos en ese rango.

El valor p calculado puede ajustarse mediante la corrección de Bonferroni. La corrección de Bonferroni es el método más sencillo para contrarrestar el problema de las comparaciones múltiples. Aquí, el valor p calculado se multiplica por el número de grupos.

Si el valor p ajustado en una comparación por pares es inferior al nivel de significación (normalmente 0.05), se rechaza la hipótesis nula de que no hay diferencias. Por tanto, si el valor p ajustado es menor que 0.05, se supone que los dos grupos respectivos difieren.

DATAtab realiza automáticamente la prueba de Dunn-Bonferroni cuando calcula una prueba de Kruskal-Wallis.

Calcula la prueba de Kruskal-Wallis en línea con DATAtab

Calcula el ejemplo directamente con DATAtab de forma gratuita:

Cargar conjunto de datos

Por supuesto, puedes calcular la prueba de Kruskal-Wallis en línea con DATAtab. Sólo tienes que ir a la calculadora estadística, copiar tus datos en la tabla de la calculadora estadística y seleccionar la pestaña "Pruebas de hipótesis". Después sólo tienes que seleccionar las variables que quieres analizar y desmarcar "Prueba paramétrica".

Kruskal-Wallis Test Calculator

DATAtab te ofrece entonces los resultados, incluida la interpretación, de la siguiente forma:

Kruskal-Wallis Test Result

Interpretación de la prueba de Kruskal-Wallis

Como en cualquier prueba estadística de hipótesis, al final interesa el valor p calculado. Se trata de saber si el valor p calculado es menor o mayor que el nivel de significación, normalmente fijado en 0.05. Si el valor p es mayor, se mantiene la hipótesis nula; en caso contrario, se rechaza.

En el ejemplo anterior, el valor p es 0.779 y, por tanto, mayor que 0.05. Es por ello que se mantiene la hipótesis nula y se supone que no hay diferencias entre los distintos grupos en cuanto al tiempo de reacción.

Informe de la prueba de Kruskal-Wallis

¿Cómo se presentan los resultados de una prueba de Kruskal-Wallis?

Se ha calculado una prueba de Kruskal-Wallis para comprobar si los grupos A, B y C tienen un efecto sobre el tiempo de reacción. La prueba de Kruskal-Wallis ha revelado que no hay diferencias significativas entre las categorías A, B y C de la variable independiente con respecto a la variable dependiente tiempo de reacción, p=0.779. Así pues, con los datos disponibles, no se rechaza la hipótesis nula.

Cita DATAtab: DATAtab Team (2024). DATAtab: Online Statistics Calculator. DATAtab e.U. Graz, Austria. URL https://datatab.es

Contacto y soporte Preguntas frecuentes y Sobre nosotros Política de privacidad Software estadístico