Prueba de Kruskal-Wallis

Qué es la prueba de Kruskal-Wallis

La prueba de Kruskal-Wallis (prueba H) es una prueba de hipótesis para muestras múltiples independientes, que se utiliza cuando no se cumplen los supuestos de un análisis de varianza de un factor.

Dado que la prueba de Kruskal-Wallis es una prueba no paramétrica (también denominada prueba sin distribución), no es necesario que los datos utilizados se distribuyan normalmente, a diferencia del análisis de la varianza. El único requisito es que los datos sean de escala ordinal.

En la prueba de Kruskal-Wallis, las variables ordinales son suficientes, ya que las pruebas no paramétricas no utilizan las diferencias de los valores, sino los rangos (qué valor es mayor, cuál es menor). Por tanto, la prueba de Kruskal-Wallis también suele denominarse "prueba ANOVA unidireccional por rangos de Kruskal-Wallis".

Ejemplos de la prueba de Kruskal-Wallis

Para la prueba de Kruskal-Wallis, por supuesto, se pueden utilizar los mismos ejemplos que para el análisis de varianza de un solo factor, pero añadiendo que los datos no tienen por qué estar distribuidos normalmente.

Ejemplo médico:

En una empresa farmacéutica se quiere comprobar si un fármaco XY influye en el peso corporal. Para ello, se administra el fármaco a 20 personas de prueba, 20 personas de prueba reciben un placebo y 20 personas de prueba no reciben ningún fármaco ni placebo.

Ejemplo de ciencias sociales:

¿Difieren 3 grupos de edad en cuanto al consumo diario de televisión?

Pregunta de investigación e hipótesis

La pregunta de investigación para la prueba de Kruskal-Wallis puede ser: ¿Existe alguna diferencia en la tendencia central de varias muestras independientes? Esta posición de la pregunta da lugar a las hipótesis nula y alternativa.

Hipótesis nula

Las muestras independientes tienen todas la misma tendencia central y, por tanto, proceden de la misma población.

Hipótesis nula

Al menos una de las muestras independientes no tiene la misma tendencia central que las demás muestras y, por tanto, procede de una población diferente.

Hipótesis para la prueba de Kruskal-Wallis

Para calcular una prueba de Kruskal-Wallis, sólo se debe disponer de varias muestras aleatorias independientes con características al menos de escala ordinal. Las variables no tienen que satisfacer una curva de distribución.

Si tienes una muestra dependiente, entonces sólo tienes que utilizar la prueba de Friedman.

Calcular la prueba de Kruskal-Wallis

El cálculo del análisis de varianza de rangos de Kruskal y Wallis es similar al de la prueba U de Mann-Whitney, que es la contrapartida no paramétrica de la prueba t para muestras independientes.

Supongamos que la hipótesis nula es cierta y, por tanto, no hay diferencia entre las muestras independientes. Entonces, los rangos altos y bajos se distribuyen aleatoriamente entre las muestras y deberían distribuirse por igual entre los grupos. Por tanto, la probabilidad de que se asigne un rango a un grupo es la misma para todos los grupos.

Si no hay diferencias entre los grupos, el valor medio de los rangos también debería ser el mismo en todos los grupos. El valor esperado de los rangos para cada grupo viene dado entonces por

Cada muestra tiene el mismo valor esperado de los rangos, que corresponde al valor esperado de la población. Además, se necesita la varianza de los rangos, la varianza se puede calcular con la siguiente fórmula:

En la prueba de Kruskal-Wallis, se calcula la variable de prueba H. El valor H corresponde al valor χ2. El valor H resulta de:

El valor H crítico puede leerse en la tabla de valores χ2 críticos.

Cálculo con datos de ejemplo

Supongamos que has medido el tiempo de reacción de tres grupos y quieres saber si hay alguna diferencia entre ellos. Para averiguarlo, utiliza ahora la prueba H (prueba de Kruskal-Wallis)

Primero asignamos un rango a cada persona, luego calculamos la suma de rangos y la suma media de rangos.

Medimos el tiempo de reacción en doce personas, por lo que el número de casos es doce. Los grados de libertad vienen dados por el número de grupos menos uno, por lo que tenemos dos grados de libertad.

Ahora hemos calculado todos los valores para calcular la cantidad de prueba H.

Una vez calculado el valor H o el valor chi-cuadrado, se puede leer el valor chi-cuadrado crítico en la tabla de valores chi-cuadrado críticos.

Con un nivel de significación del 5%, el valor crítico de chi-cuadrado es, por tanto, 5.991. Este valor crítico es, por tanto, mayor que el valor de chi-cuadrado o H calculado. Así pues, se mantiene la hipótesis nula y no hay diferencias en el tiempo de reacción en los tres grupos.

Prueba post-hoc

La prueba de Kruskal-Wallis puede utilizarse para determinar si al menos dos grupos difieren entre sí. La prueba de Kruskal-Wallis no proporciona una respuesta a la pregunta de cuál de los grupos difiere; para ello se requiere una prueba post-hoc.

Para ello, la prueba de Dunn es la prueba no paramétrica adecuada para la comparación múltiple por pares.

Pruebas de Dunn-Bonferroni

Para averiguar cuáles de los pares difieren, los grupos individuales pueden compararse por pares. La prueba de Dunn se utiliza para calcular el valor p de cada par. Para comparar los grupos A y B, se calcula el valor z mediante la siguiente fórmula.

donde i es uno de los grupos y _yi= W A-W B es la diferencia de las sumas medias de los rangos. El error típico viene dado por

Donde N es el número de todos los casos, r es el número de rangos conectados y _τs es el número de casos en ese rango.

El valor p calculado puede ajustarse mediante la corrección de Bonferroni. La corrección de Bonferroni es el método más sencillo para contrarrestar el problema de las comparaciones múltiples. Aquí, el valor p calculado se multiplica por el número de grupos.

Si el valor p ajustado en una comparación por pares es inferior al nivel de significación (normalmente 0.05), se rechaza la hipótesis nula de que no hay diferencias. Por tanto, si el valor p ajustado es menor que 0.05, se supone que los dos grupos respectivos difieren.

DATAtab realiza automáticamente la prueba de Dunn-Bonferroni cuando calcula una prueba de Kruskal-Wallis.

Calcula la prueba de Kruskal-Wallis en línea con DATAtab

Calcula el ejemplo directamente con DATAtab de forma gratuita:

Kruskal-Wallis-Test cargar conjunto de datos

Por supuesto, puedes calcular la prueba de Kruskal-Wallis en línea con DATAtab. Sólo tienes que ir a la calculadora estadística, copiar tus datos en la tabla de la calculadora estadística y seleccionar la pestaña "Pruebas de hipótesis". Después sólo tienes que seleccionar las variables que quieres analizar y desmarcar "Prueba paramétrica".

DATAtab te ofrece entonces los resultados, incluida la interpretación, de la siguiente forma:

Interpretación de la prueba de Kruskal-Wallis

Como en cualquier prueba estadística de hipótesis, al final interesa el valor p calculado. Se trata de saber si el valor p calculado es menor o mayor que el nivel de significación, normalmente fijado en 0.05. Si el valor p es mayor, se mantiene la hipótesis nula; en caso contrario, se rechaza.

En el ejemplo anterior, el valor p es 0.779 y, por tanto, mayor que 0.05. Por tanto, se mantiene la hipótesis nula y se supone que no hay diferencias entre los distintos grupos en cuanto al tiempo de reacción.

Informe de la prueba de Kruskal-Wallis

¿Cómo se presentan los resultados de una prueba de Kruskal-Wallis?

Se calculó una prueba de Kruskal-Wallis para comprobar si los grupos A, B y C tienen un efecto sobre el tiempo de reacción. La prueba de Kruskal-Wallis reveló que no hay diferencias significativas entre las categorías A, B y C de la variable independiente con respecto a la variable dependiente tiempo de reacción, p=0.779. Así pues, con los datos disponibles, no se rechaza la hipótesis nula.