Muestras dependientes e independientes
¿Cuál es realmente la diferencia entre una muestra dependiente y una independiente (muestras pareadas o no pareadas)? ¿Y por qué es importante conocer la diferencia? El hecho de que los datos procedan de una muestra dependiente o independiente determina qué prueba de hipótesis se utiliza.
Si tus datos son independientes, se puede calcular, por ejemplo, una prueba t para muestras independientes o un análisis de varianza sin medidas repetidas. Si, por el contrario, tus datos son dependientes, se puede calcular, por ejemplo, una prueba t para muestras dependientes o un ANOVA con medidas repetidas.
Ejemplo de variable independiente y dependiente
Supongamos que quieres averiguar si las vacaciones influyen en los niveles de estrés de las personas. Para averiguarlo, has creado una pequeña encuesta online en datatab.de, con la que mides el nivel de estrés de la gente. Con la encuesta preguntas a la gente antes y después de sus vacaciones sobre su nivel de estrés. Ahora hay dos posibilidades:
En el caso izquierdo, tendrías una muestra independiente, porque las personas a las que entrevistaste antes de las vacaciones no tienen nada que ver con las personas a las que entrevistaste después de las vacaciones.
En el caso derecho, tendrías entonces una muestra dependiente, encuestamos a las personas antes de las vacaciones y encuestamos a las mismas personas después de las vacaciones, por lo que las mediciones son siempre por pares. ¡Ésta es la solución preferida en esta pregunta de investigación!
Muestra dependiente
En una muestra dependiente (o muestra pareada), los valores medidos están conectados. Por ejemplo, si se extrae una muestra de personas operadas de la rodilla y se entrevista a cada una de ellas antes y después de la operación, se trata de una muestra dependiente. Esto es así porque se entrevistó a la misma persona en dos momentos diferentes.
Por supuesto, no tiene por qué existir necesariamente una relación antes-después que se quiera investigar.
También existe una muestra dependiente si, por ejemplo, quieres comprobar si un nuevo tipo de bate de béisbol influye en las características de golpeo y las mismas personas juegan una vez con el bate antiguo y otra con el nuevo. Entonces los valores medidos también están disponibles por pares, cada jugador ha utilizado ambos bates y, por tanto, hay dos valores medidos de cada jugador.
Y tampoco tiene por qué ser la misma persona. Por ejemplo, si quisieras averiguar si en una relación entre mujeres y hombres, las mujeres hacen más jardinería que los hombres, también tendrías una muestra dependiente. Tendrías mediciones que siempre van por pares, siempre una mujer y un hombre.
Muestra independiente
En las muestras independientes (o muestra no pareada), los valores proceden de dos o más grupos diferentes. Por ejemplo, si se pregunta al grupo de hombres y al grupo de mujeres por sus ingresos, las muestras son independientes. En este caso, una persona de una muestra no puede asignarse a una persona de la otra muestra.
Más de dos muestras dependientes o independientes
Por supuesto, en el caso de muestras independientes y dependientes, también puede haber más de dos muestras. Lo importante es que en el caso de una muestra independiente los grupos o muestras individuales no tienen nada que ver entre sí, mientras que en el caso de una muestra dependiente, un encuestado está presente en todos los grupos.
Pruebas de hipótesis para muestras dependientes e independientes
En general, siempre hay una prueba de hipótesis para las muestras independientes y una homóloga para las muestras dependientes. En lugar de los términos dependiente e independiente, a menudo se utilizan pareadas y no pareadas en el caso del análisis de la varianza con y sin medidas repetidas, así como en el caso de la prueba t.
Muestra dependiente | Muestra independiente |
---|---|
Prueba t para muestras dependientes | Prueba t para muestras independientes |
ANOVA con medidas repetidas | ANOVA sin medidas repetidas |
Prueba de Wilcoxon | Prueba U de Mann-Whitney |
Prueba de Friedman | Prueba de Kruskal-Wallis |
En DATAtab puedes elegir con un clic si quieres calcular la prueba de hipótesis respectiva para muestras dependientes o independientes.
Dependiendo del formato en el que insertes tus datos, se preselecciona una variante. Normalmente, una serie es un encuestado o, más generalmente, un caso. Por tanto, los valores métricos que están en una serie se consideran inicialmente dependientes.
Si se hace clic en una variable métrica y en una variable categórica, se selecciona automáticamente la prueba independiente correspondiente.