Menu

Análisis factorial exploratorio

El análisis factorial exploratorio es un método que pretende descubrir estructuras en grandes conjuntos de variables. Si tiene un conjunto de datos con muchas variables, es posible que algunas de ellas estén interrelacionadas, es decir, que estén correlacionadas entre sí. Estas correlaciones son la base del análisis factorial.

El objetivo del análisis factorial es dividir las variables en grupos. Se trata de separar las variables que están muy correlacionadas de las que lo están menos.

¿Qué es un factor?

En el análisis factorial, el factor puede verse como una variable oculta que influye en varias variables realmente observadas.

Factor Analysis

O, en otras palabras, varias variables son fenómenos observables de menos factores subyacentes.

Por tanto, en el análisis factorial se combinan las variables que tienen una alta correlación. Se supone que esta correlación se debe a una variable no medible, que se denomina factor.

Ejemplo de análisis factorial

El análisis factorial puede utilizarse para responder a las siguientes preguntas

  • ¿Qué estructura puede detectarse en los datos?
  • ¿Cómo se pueden reducir los datos a algunos factores?

La siguiente tabla contiene ejemplos de contenido que muestran dónde se utiliza el análisis factorial en diferentes campos.

Ejemplos

Pregunta Variable Posibles factores
Psicológicos ¿Pueden agruparse los diferentes rasgos de personalidad en tipos de personalidad? Ser sociable, ser espontáneo, ser curioso, ser nervioso, ser agresivo, etc. Neuroticismo, Extraversión, Apertura a lo nuevo, Conciencia, Compatibilidad social
Administración de empresas ¿Cómo se pueden resumir los diferentes tipos de costes en características de costes? Costes de material, costes de personal, costes de equipo, costes fijos, etc. Influenciabilidad, urgencia de cobertura

Preguntas de investigación Análisis de factores

Una posible pregunta de investigación podría ser ¿Pueden agruparse diferentes rasgos de personalidad, como extrovertido, curioso, sociable o servicial, en tipos de personalidad como concienzudo, extrovertido o agradable?

Exploratory Factor Analysis

Pongamos que quieres averiguar si algunas de las características sociable, trabajador, concienzudo, afectuoso o servicial se correlacionan entre sí y pueden ser descritas por un factor subyacente. Para averiguarlo, has creado una pequeña encuesta con DATAtab.

Has entrevistado a 20 personas y has agrupado los resultados en una tabla de Excel. Aquí encontrará el conjunto de datos de ejemplo para el Análisis de Componentes Principales con el que puede calcular el ejemplo directamente en línea en DATAtab con la Calculadora de Análisis de Factores.

Carga factorial, valor propio, comunalidades

Los términos importantes o valores característicos para un análisis factorial son la carga factorial, el valor propio y las comunalidades. Con su ayuda, es posible ver cuán fuerte es la correlación entre las variables individuales y los factores.

Carga factorial

  • Correlación entre una variable y un factor
  • Carga de una variable en un factor

Valor propio

  • La varianza explicada por un factor
  • Suma de las cargas factoriales al cuadrado

Comunidades

  • Varianza de las variables que es explicada por todos los factores
  • Suma de las cargas factoriales al cuadrado de una variable
factor load, eigenvalue, communalities

Matriz de correlaciones

El primer paso del análisis factorial consiste en calcular la matriz de correlaciones. A partir de la matriz de correlaciones, se resuelve el llamado problema de los valores propios, que se utiliza para calcular los factores.

Correlation Matrix PCA

Análisis factorial y dimensionalidad

Sin embargo, es importante tener en cuenta que el análisis factorial no da una respuesta "clara" sobre cuántos factores hay que utilizar y cómo se pueden interpretar estos factores.

Existen dos métodos habituales para determinar el número de factores necesarios: el criterio del valor propio (criterio de Kaiser) y la prueba de scree.

Criterio del valor propio (criterio de Kaiser)

Para determinar las dimensiones, es decir, el número de factores, con la ayuda del criterio de valores propios, o criterio de Kaiser, se necesitan los valores propios de los factores individuales. Si se calculan, se utilizan todos los factores con valores propios superiores a 1.

Prueba de selección

Para determinar el número de factores con la ayuda de la prueba scree o diagrama de sedimentación, los valores propios se ordenan por tamaño y se representan mediante un diagrama de líneas. Donde hay un punto en el gráfico, puede leerse el número de factores.

Scree-Test

Además, en la tabla "Varianza total explicada" puede leerse la varianza que explica cada factor individual y la varianza acumulada.

Explained total variance PCA

Comunalidades

Una vez determinado el número de factores, se pueden calcular las comunalidades. Como se ha escrito anteriormente, la comunalidad indica la varianza de las variables, que es explicada por todos los factores. Si, por ejemplo, se han seleccionado tres factores, las comunalidades dan la parte de la varianza de la variable respectiva que se puede describir con estos tres factores.

Communalities

Matriz de componentes

La matriz de componentes indica las cargas factoriales de los factores sobre las variables. Dado que el primer factor explica la mayor parte de la varianza, los valores del primer componente o factor son los mayores. Sin embargo, con esta forma de representación es difícil hacer una afirmación sobre los factores, por lo que esta matriz se sigue rotando.

Component matrix PCA

Matriz de rotación

El cálculo de la matriz de componentes tiene como consecuencia que en el primer factor muchas variables tienen una carga elevada. Esto hace que la matriz de componentes no pueda interpretarse de forma significativa. Es por ello que se lleva a cabo una rotación de esta matriz. Para esta rotación existen diferentes procedimientos, pero el más común es la rotación Varimax analítica.

Rotación Varimax

Con la ayuda de la rotación Varimax se debe asegurar analíticamente que por factor ciertas variables carguen lo más alto posible y las otras variables carguen lo más bajo posible. Esto se obtiene cuando la varianza de las cargas factoriales por factor debe ser lo más alta posible.

Rotation Matrix (Varimax)

Aquí hay que reconocer ahora que "extrovertido" y "sociable" cargan sobre la extroversión, "laborioso" y "cumplidor" sobre la conciencia y "afectuoso" y "servicial" sobre la amabilidad.

Cita DATAtab: DATAtab Team (2024). DATAtab: Online Statistics Calculator. DATAtab e.U. Graz, Austria. URL https://datatab.es

Contacto y soporte Preguntas frecuentes y Sobre nosotros Política de privacidad Software estadístico