Creador de diagramas de caja
Aquí encontrarás todo sobre el diagrama de caja, o boxplot. Puedes hacer fácilmente tu diagrama de caja en línea o simplemente leer la teoría a continuación. Los diagramas de caja ofrecen una rápida y buena imagen de las distribuciones existentes en tus datos. Para hacer tu propio diagrama de caja, simplemente copia tus datos en la tabla superior y selecciona la variable deseada abajo.
Crear un diagrama de caja en línea
Para crear un diagrama de caja en línea, simplemente selecciona las variables de las que deseas crear un diagrama de caja. Dependiendo del nivel de escala de las variables seleccionadas, se creará el diagrama de caja adecuado. Por ejemplo, si seleccionas una métrica y una variable nominal con tres niveles, se creará un diagrama de caja para los tres grupos.
Explicación del diagrama de caja
¿Qué es un diagrama de caja? Los diagramas de caja se utilizan en estadística para mostrar claramente la mediana, la media y la dispersión de los datos de manera gráfica. Los datos deben tener al menos una escala de intervalo. Un diagrama de caja se utiliza a menudo para comparar y contrastar dos o más grupos. Los diagramas de caja también se denominan diagramas de caja y bigotes (o simplemente boxplots, del inglés).
Interpretación del Diagrama de caja
Un diagrama de caja contiene mucha información, por lo que la interpretación del diagrama de caja puede ser muy versátil. Un diagrama de caja consta de tres partes: la caja, el bigote en forma de T, también llamado "feeler", y dos líneas.
- la caja
- el bigote en forma de T
- dos líneas
La caja indica el rango en el que se encuentran el 50% de los datos. El extremo inferior de la caja es, por tanto, el primer cuantil y el extremo superior el tercer cuantil.
En el diagrama de caja, la línea continua indica la mediana y la línea discontinua el valor medio.
Los bigotes en forma de T llegan hasta el último punto, que sigue siendo 1.5 veces la distancia intercuartil. Los puntos más alejados se consideran valores atípicos. Si ningún punto se encuentra a más de 1.5 veces la distancia intercuartil, el bigote en forma de T indica el valor máximo o mínimo.
Los bigotes en forma de T
La definición de los bigotes no siempre es uniforme, en la mayoría de los casos se utiliza la definición superior, que los bigotes van hasta el último punto, que sigue estando dentro de esas 1.5 veces la distancia intercuartil. Los diagramas de caja creados en línea en DATAtab también se adhieren a esta definición. Ocasionalmente, los bigotes son simplemente el mínimo y el máximo.
Los valores atípicos
Para determinar los valores atípicos en los datos dados se utiliza la distancia intercuartil. Esto se hace de forma similar a los bigotes. Todos los puntos que distan más que 1.5 veces la distancia intercuartil se consideran valores atípicos. Así, en los diagramas de caja creados en línea, todos los valores por encima y por debajo del bigote son valores atípicos.