Para un uso óptimo, ¡visita DATAtab en tu ordenador de sobremesa!

Calcular:
Variables métricas:

Cómo hacerlo

calculadora de agrupación de k-means

¿Quieres averiguar qué estructura hay en tus datos? Entonces utiliza la calculadora de Análisis Cluster aquí en DATAtab y selecciona al menos dos variables métricas. Con los análisis de conglomerados, puedes descubrir estructuras de similitud en tus datos.

¿Quieres calcular un análisis cluster? Sólo son necesarios tres pasos:

  • Copia tus datos en la tabla
  • Selecciona más de una variable
  • Selecciona el número de conglomerados que quieres calcular

Los conglomerados se pueden calcular utilizando varios métodos de agrupación. Éstos pueden dividirse en

  • gráfico-teórico
  • jerárquicamente
  • partición
  • optimizando

DATAtab te calcula el Cluster k-means y el cluster jerárquico. El algoritmo asigna cada punto de datos al conglomerado cuyo centro (o "centroide") esté más próximo a él. Los centroides se vuelven a calcular después de cada asignación, y el proceso se repite hasta que los conglomerados ya no cambian significativamente. Esto ayuda a identificar patrones o estructuras en los datos.

Calculadora de k-medias online

El método k-Means, desarrollado por MacQueen (1967), es uno de los métodos no jerárquicos más utilizados. Es un método de partición, especialmente adecuado para grandes cantidades de datos.

  • En primer lugar, se crea una partición inicial con k conglomerados (número dado de conglomerados).
  • A continuación, empezando por el primer objeto del primer clúster, se calculan las distancias euclídeas de todos los objetos a todos los focos de los clústeres.
  • Si se detecta un objeto cuya distancia al centro de gravedad del propio cluster es mayor que la distancia al centro de gravedad (centroide) de otro cluster, este objeto se desplaza al otro cluster.
  • Por último, se calculan de nuevo los centroides de los dos clusters cambiados, ya que aquí han cambiado las composiciones.
  • Estos pasos se repiten hasta que cada objeto se sitúa en un cluster con la menor distancia a su centroide (centro del cluster) (solución óptima).
k means calculator

Número óptimo de conglomerados

El número de conglomerados en el método k-Means debe determinarse antes del inicio y, por tanto, no viene determinado por el método de conglomerados. Pero, ¿cuál es el número óptimo de conglomerados en el método k-Means? El método del codo es una forma habitual de determinar el número adecuado de conglomerados.

Curva del codo

Cuando quieres calcular un análisis de conglomerados, a menudo la gran pregunta es cuántos conglomerados debo tomar, ¡El método del codo ayuda con esta pregunta! Con cada nuevo conglomerado, la variación total en cada conglomerado se hace cada vez más pequeña. En el caso extremo, cuando hay tantos conglomerados como puntos, el resultado es cero. Sin embargo, en la mayoría de los casos, la reducción de la variación total se hace menor a partir de cierto punto. Este punto se utiliza entonces como número óptimo de conglomerados.

Elbow curve

Escalado de datos para la agrupación de k-means

Si las variables consideradas no tienen la misma unidad, a menudo es aconsejable escalar los datos antes del análisis de conglomerados.

Cita DATAtab: DATAtab Team (2024). DATAtab: Online Statistics Calculator. DATAtab e.U. Graz, Austria. URL https://datatab.es

Contacto y soporte Preguntas frecuentes y Sobre nosotros Política de privacidad Software estadístico