Diagrama de caja
¿Qué es un diagrama de caja (Boxplot)? Con un diagrama de caja puede mostrar gráficamente mucha información sobre sus datos. Entre otras cosas, en un diagrama de caja puede leerse la mediana, el rango intercuartílico y los valores atípicos.
Los datos utilizados suelen ser de escala métrica, como la edad de una persona, el consumo anual de electricidad o la temperatura.
A menudo se crea un diagrama de caja para comparar y contrastar dos o más grupos. Por ejemplo, la edad de diferentes grupos.
¿Cómo se interpreta un diagrama de caja?
La propia caja indica el intervalo en el que se encuentra el 50% de todos los valores. Así, el extremo inferior de la caja es el 1er cuartil y el extremo superior es el 3er cuartil.
Por lo tanto, si por debajo de q1 se encuentra el 25% de los datos y por encima de q3 se encuentra el 25% de los datos, en la propia caja se encuentra el 50% de los datos.
Supongamos que observamos la edad de los individuos en un diagrama de caja, y q1 es 31 años, entonces significa que el 25% de los participantes son menores de 31 años. Si q3 es 63 años, significa que el 25% de los participantes tienen más de 63 años, por lo que el 50% de los participantes tienen entre 31 y 63 años. Así pues, entre q1 y q3 está el rango intercuartílico.
En el diagrama de caja, la línea continua indica la mediana y la línea discontinua, la media.
Por ejemplo, si la mediana es 42, significa que la mitad de los participantes son menores de 42 años y la otra mitad mayores de 42 años. Así pues, la mediana divide a los individuos en dos grupos iguales.
Los bigotes en forma de T llegan hasta el último punto, que sigue estando dentro de 1.5 veces el rango intercuartílico. ¿Qué significa esto? El bigote en forma de T es el valor máximo de tus datos, pero como máximo 1.5 veces el rango intercuartílico. Por lo tanto, si hay un valor atípico, el bigote llega hasta 1.5 veces el rango intercuartílico. Si no hay ningún valor atípico, el bigote es el valor máximo.
Así que el bigote superior es el valor máximo o 1.5 veces el rango intercuartílico. Dependiendo de qué valor sea menor. Lo mismo ocurre con el bigote inferior, que es el mínimo o 1.5 veces el rango intercuartílico.
Los puntos más alejados se consideran valores atípicos. Si ningún punto está más alejado que 1.5 veces el rango intercuartílico, el bigote en forma de T indica el valor máximo o mínimo.
Crear diagrama de caja en línea
En DATAtab puede crear fácilmente un diagrama de caja en línea. Para ello, haga clic en la calculadora estadística, copie sus propios datos en la tabla, seleccione la pestaña "Descriptivo" o "Gráficos" y haga clic en las variables para las que desea crear un diagrama de caja.
En el diagrama de caja superior creado con DATAtab online, se contrastó la localización de las caídas en un hospital con la edad de las personas que se cayeron.