Menu

ANOVA de dos factores o vías (sin medidas repetidas)

¿Qué es un ANOVA de dos vías?

El análisis de varianza de dos vías (o de dos factores) comprueba si hay diferencias entre más de dos muestras independientes divididas en dos variables o factores.

Two-factor analysis of variance without repeated measures

¿Qué es un factor?

Un factor es, por ejemplo, el sexo de una persona con las características hombre y mujer, la forma de terapia utilizada para una enfermedad con la terapia A, B y C o el campo de estudio con, por ejemplo, medicina, administración de empresas, psicología y matemáticas.

What is a factor?

En el caso del análisis de la varianza, un factor es una variable categórica. Utilizarás un análisis de la varianza siempre que quieras probar si estas categorías influyen en la llamada variable dependiente.

Por ejemplo, podrías comprobar si el sexo influye en el salario, si la terapia influye en la tensión arterial o si el campo de estudio influye en la duración de los estudios. El salario, la tensión arterial y la duración de los estudios son entonces las variables dependientes. En todos estos casos, puedes comprobar si el factor influye en la variable dependiente.

Como en estos casos sólo tienes un factor, utilizarías un análisis de varianza de un solo factor (excepto, por supuesto, en el caso del sexo, en el que tenemos una variable con sólo dos expresiones, en cuyo caso utilizaríamos la prueba t para muestras independientes).

Dos factores

Ahora bien, puede que tengas otra variable categórica que también quieras incluir. Puede que te interese saber si

  • además del sexo, el nivel de estudios más alto también influye en el salario.
  • además de la terapia, el sexo también influye en la tensión arterial.
  • además del campo de estudio, la universidad a la que se asiste también influye en la duración de los estudios.
One Factorial vs Two Factor ANOVA

En los tres casos no tendrías un factor, sino dos factores en cada uno. Y como ahora tienes dos factores, debes utilizas el análisis de varianza de dos factores.

Utilizando el análisis de varianza de dos factores puedes responder a tres cosas:

  • ¿Tiene el factor 1 efecto sobre la variable dependiente?
  • ¿Tiene el factor 2 efecto sobre la variable dependiente?
  • ¿Existe una interacción entre el factor 1 y el factor 2?

Por tanto, si en el caso del análisis de varianza de un factor, tenemos un factor a partir del cual creamos los grupos, en el caso del análisis de varianza de dos factores, los grupos resultan de la combinación de las expresiones de los dos factores.

One factor vs. two factors

Ejemplo de ANOVA de dos vías

A continuación se muestra un conjunto de datos de ejemplo para un ANOVA de dos vías en medicina. Supongamos que estamos interesados en estudiar el efecto de dos factores, "Tratamiento" y "Sexo", sobre la variable de respuesta "Tensión arterial".

Cargar conjunto de datos

En este ejemplo, tenemos dos niveles del factor "Tratamiento" (A y B) y dos niveles del factor "Sexo" (hombre y mujer). Las mediciones de "Tensión arterial" se registran para cada participante en función de su tratamiento y sexo.

Para realizar un ANOVA de dos vías en este conjunto de datos, probaríamos la hipótesis nula de que no hay interacción entre los factores "Tratamiento" y "Sexo" ni efectos principales de cada factor en la variable de respuesta "Tensión arterial".

Hipótesis

Con el ANOVA de 2 factores se pueden probar tres afirmaciones, por lo que hay 3 hipótesis nulas y, por tanto, 3 hipótesis alternativas.

Hipótesis nulas H0 Hipótesis alternativas H1
No hay diferencias significativas en la media entre los grupos (niveles de los factores) del primer factor. Hay una diferencia significativa en la media entre los grupos (niveles de los factores) del primer factor.
No hay diferencias significativas en la media entre los grupos (niveles de los factores) del segundo factor. Hay una diferencia significativa en la media entre los grupos (niveles de los factores) del segundo factor.
Un factor no influye en el efecto del otro factor. Un factor tiene un efecto sobre el efecto del otro factor.

Supuestos

Para que pueda calcularse un análisis de varianza de dos factores sin medidas repetidas, deben cumplirse los siguientes supuestos:

  • El nivel de escala de la variable dependiente debe ser métrico, y el de las variables independiente (factores) nominal.
  • Independencia: Las medidas deben ser independientes, es decir, el valor medido de un grupo no debe estar influido por el valor medido de otro grupo. Si éste fuera el caso, necesitaríamos un análisis de varianza con medidas repetidas.
  • Homogeneidad: Las varianzas de cada grupo deben ser aproximadamente iguales. Esto puede comprobarse con la prueba de Levene.
  • Distribución normal: Los datos dentro de los grupos deben distribuirse normalmente.

Así, la variables dependientes podrían ser, por ejemplo, el salario, la tensión arterial o la duración del estudio. Todas ellas son variables métricas. Y la variable independiente debe tener una escala nominal u ordinal. Por ejemplo, el sexo, el nivel educativo más alto o un tipo de terapia. Ten en cuenta, sin embargo, que el orden de rango no se utiliza con variables ordinales, por lo que esta información se pierde.

Calcular el ANOVA de dos vías o factores

Para calcular un ANOVA de dos factores, se necesitan las siguientes fórmulas. Veámoslo con un ejemplo.

Two-factor ANOVA formula

Supongamos que trabajas en el departamento de marketing de un banco y quieres averiguar si el sexo y el hecho de que una persona haya estudiado o no influyen en su actitud hacia la planificación de la jubilación.

En este ejemplo, tus dos variables independientes (factores) son el sexo (hombre o mujer) y los estudios (sí o no). Tu variable dependiente es la actitud hacia la planificación de la jubilación, donde 1 significa "nada importante" y 10 significa "muy importante".

Two-Factor ANOVA Sample Data

Después de todo, ¿es la actitud hacia la planificación de la jubilación realmente una variable métrica? Supongamos que la actitud hacia la planificación de la jubilación se midió utilizando una escala de Likert y, por tanto, consideramos que la variable resultante es métrica.

Valores medios

En el primer paso calculamos los valores medios de los grupos individuales, es decir, de hombres sin estudios, que es 5.8, luego de hombres con estudios, que es 5.4, y después hacemos lo mismo con las mujeres.

A continuación, calculamos la media de todos los hombres y mujeres y de personas con y sin estudios respectivamente. Por último, calculamos que la media global es 5.4.

Sumas de cuadrados

Con esto, ya podemos calcular las sumas de cuadrados necesarias. SStot es la suma de cuadrados de cada valor individual menos la media global.

Two-factor ANOVA Sum of squares

SSbtw resulta de la suma de cuadrados de las medias de los grupos menos la media global multiplicada por el número de valores de los grupos.

Las sumas de cuadrados de los factores SSA y SSB resultan de la suma de cuadrados de las medias de los niveles de los factores menos la media total.

Ahora podemos calcular la suma de cuadrados de la interacción. Se obtiene calculando SSbtw menos SSA menos SSB.

Por último, calculamos la suma de cuadrados para el error. Esto se calculará de forma similar a la suma total de cuadrados, así que de nuevo utilizamos cada valor individual. Sólo que en este caso, en lugar de restar la media global de cada valor, restamos la media del grupo respectivo de cada valor.

Grados de libertad

Los grados de libertad necesarios son los siguientes

2 factorial ANOVA Degrees of freedom

Cuadrados medios o varianza

Junto con las sumas de cuadrados y los grados de libertad, ahora se puede calcular la varianza:

Two factorial ANOVA Variance

Valor F

Y ahora podemos calcular los valores F. Se obtienen dividiendo la varianza del factor A, del factor B o de la interacción AB por la varianza del error.

Two-factor analysis of variance F-value

Valor p

Para calcular el valor p, necesitamos el valor F, los grados de libertad y la distribución F. Utilizamos la calculadora del valor p de la distribución F en DATAtab. Por supuesto, también puedes calcular el ejemplo completamente con DATAtab, pero veremos más sobre esto en la siguiente sección.

Two-factor ANOVA p-value and critical F-value

Esto nos da un valor p de 0.323 para el Factor A, un valor p de 0.686 para el Factor B y un valor p de 0.55 para la interacción. Ninguno de estos valores p es inferior a 0.05, por lo que mantenemos las respectivas hipótesis nulas.

Cálculo de ANOVA de dos factores con DATAtab

Calcula el ejemplo directamente con DATAtab de forma gratuita:

Cargar conjunto de datos ANOVA

Tomamos el mismo ejemplo anterior. Ahora los datos están dispuestos de forma que tu software estadístico pueda hacer algo con ellos. En cada fila hay un encuestado.

Actitud hacia la planificación de la jubilación Estudios Sexo
6 no hombre
4 no hombre
5 no mujer
... ... ...
5 mujer
9 mujer
2 mujer
3 mujer

Este ejemplo consta de sólo 20 casos, lo que por supuesto no es mucho, y nos da una potencia de prueba muy baja, pero como ejemplo debería valer.

Para calcular un análisis de varianza de dos factores en línea, sólo tienes que visitar datatab.com y copiar tus propios datos en esta tabla.

A continuación, haz clic en Prueba de hipótesis. En esta pestaña encontrarás un montón de pruebas de hipótesis y, dependiendo de las variables que selecciones, se te sugerirá una prueba de hipótesis adecuada.

Calculate two factorial ANOVA with DATAtab

Cuando copies tus datos en la tabla, las variables aparecerán debajo de la tabla; si no se detecta automáticamente el nivel de escala correcto, sólo tienes que cambiarlo haciendo clicando en el nivel de escala en cuestión.

Queremos saber si el sexo y el hecho de haber estudiado o no influyen en tu actitud hacia la planificación de la jubilación. Así que simplemente hacemos clic en las tres variables.

DATAtab calculará ahora automáticamente un análisis de varianza de dos vías o factores sin medidas repetidas. DATAtab emite las tres hipótesis nulas y las tres alternativas, luego los estadísticos descriptivos y la prueba de Levene de igualdad de varianza. Con la prueba de Levene puedes comprobar si las varianzas dentro de los grupos son iguales. El valor p es superior a 0.05, por lo que suponemos la igualdad de varianzas dentro de los grupos para estos datos.

Two factorial ANOVA results

A continuación vienen los resultados del ANOVA de dos vías o factores.

Interpreting Two Factorial ANOVA

Interpretación del ANOVA de dos vías o factores

Lo más importante de esta tabla son las tres filas marcadas. Con estas tres filas puedes comprobar si se mantienen o rechazan las 3 hipótesis nulas que formulamos anteriormente.

La primera fila comprueba la hipótesis nula de si haber o no estudiado tiene un efecto sobre la actitud hacia la planificación de la jubilación. La segunda fila comprueba la de si el sexo tiene un efecto sobre la actitud. Por último, la tercera fila comprueba la hipótesis nula de si uno de los factores tiene efecto en el otro.

Puedes leer el valor p en cada caso en la última columna. Pongamos que fijamos el nivel de significación en el 5%. Si nuestro valor p calculado es inferior a 0.05, se rechaza la hipótesis nula, y si el valor p calculado es superior a 0.05, se mantiene la hipótesis nula.

Así, en este caso, vemos que los tres valores p son superiores a 0.05 y, por tanto, no podemos rechazar ninguna de las tres hipótesis nulas.

Por tanto, ni el hecho de haber estudiado o no ni el sexo tienen un efecto significativo en las actitudes hacia la planificación de la jubilación. Y tampoco existe una interacción significativa entre haber estudiado y el sexo en cuanto a las actitudes hacia la planificación de la jubilación.

Si no sabes exactamente cómo interpretar los resultados, también puedes hacer clic en Resumen en palabras. Además, es importante comprobar de antemano si se cumplen los supuestos previos para el análisis de la varianza.

Efecto de interacción

Pero, ¿qué significa exactamente interacción? Veamos primero este diagrama.

Interaction

En el eje Y se representa la variable dependiente, en nuestro ejemplo: la actitud hacia la previsión para la jubilación. En el eje X se representa uno de los dos factores, tomemos el sexo. El otro factor se representa con líneas de distintos colores. El verde es "con estudios" y el rojo es "sin estudios".

Los puntos extremos de las líneas son los valores medios de los grupos, por ejemplo, hombre y sin estudios.

En este diagrama se puede ver que tanto el sexo como la variable haber o no estudiado influyen en las actitudes hacia la planificación de la jubilación. Las mujeres tienen un valor más alto que los hombres y haber estudiado tiene un valor más alto que no haber estudiado.

Pero ahora pasemos finalmente a los efectos de interacción, para ello comparamos estos dos gráficos.

Interaction effect

En el primer caso, dijimos que no hay efecto de interacción. Si una persona ha estudiado, tiene un valor que es, digamos, 1.5 superior al de una persona que no ha estudiado.

Este aumento de 1.5 es independiente de que la persona sea hombre o mujer.

En este caso es diferente, aquí las personas que han estudiado también tienen un valor más alto, pero cuánto más alto es el valor depende de si se es hombre o mujer. Si soy hombre, hay una diferencia de, digamos, por ejemplo, 0.5 y si soy mujer, hay una diferencia de 3.5.

Así que en este caso tenemos claramente una interacción entre el sexo y el estudio, porque las dos variables se afectan mutuamente. La influencia de los estudios varía en función de si soy hombre o mujer.

En este caso, tenemos un efecto de interacción, pero la dirección sigue siendo la misma. Así que las mujeres tienen puntuaciones más altas que los hombres y los que han estudiado tienen puntuaciones más altas que los que no han estudiado.

Cita DATAtab: DATAtab Team (2024). DATAtab: Online Statistics Calculator. DATAtab e.U. Graz, Austria. URL https://datatab.es

Contacto y soporte Preguntas frecuentes y Sobre nosotros Política de privacidad Software estadístico