Menu

Correlación de Pearson

El análisis de correlación de Pearson examina la relación entre dos variables. Por ejemplo, ¿existe una correlación entre la edad de una persona y su salario?

Pearson Correlation

Más concretamente, podemos utilizar el coeficiente de correlación de Pearson para medir la relación lineal entre dos variables.

Fuerza y dirección de la correlación

Con un análisis de correlación podemos determinar

  • la fuerza de la correlación
  • y en qué dirección va.

Podemos leer la fuerza y la dirección de la correlación en el coeficiente de correlación de Pearson r, cuyo valor varía entre -1 y 1.

La fuerza de la correlación

La fuerza de la correlación puede leerse en una tabla. Un valor de r entre 0 y 0.1 indica que no existe correlación. Un valor de r entre 0.7 y 1 indica una correlación muy alta.

Valor r Fuerza de la correlación
0.0 < 0.1 no hay correlación
0.1 < 0.3 poca correlación
0.3 < 0.5 correlación media
0.5 < 0.7 correlación alta
0.7 < 1 correlación muy alta
De Kuckartz et al: Statistik, Eine verständliche Einführung, 2013, p. 213

Dirección de la correlación

Existe una correlación positiva cuando valores grandes de una variable están asociados a valores grandes de la otra variable, o cuando valores pequeños de una variable están asociados a valores pequeños de la otra variable.

Coeficiente de correlación de Pearson positivo

Se produce una correlación positiva, por ejemplo, entre la altura y el número de calzado. El coeficiente de correlación es, por lo tanto, positivo.

coeficiente de correlación positiva

Una correlación negativa se da cuando valores grandes de una variable se asocian a valores pequeños de la otra variable y viceversa.

coeficiente de correlación de Pearson negativo

Se suele encontrar una correlación negativa entre el precio del producto y el volumen de ventas. El coeficiente de correlación es, por lo tanto, negativo.

coeficiente de correlación negativa

Calcular la correlación de Pearson

El coeficiente de correlación de Pearson se calcula mediante la siguiente ecuación. Aquí r es el coeficiente de correlación de Pearson, xi son los valores individuales de una variable, por ejemplo la edad, yi son los valores individuales de la otra variable, por ejemplo el salario, y e son los valores medios de las dos variables respectivamente.

Ecuación Correlación de Pearson

En la ecuación, podemos ver que el valor medio respectivo se resta primero de ambas variables.

Así, en nuestro ejemplo, primero calculamos los valores medios de la edad y el salario. Luego restamos los valores medios de la edad y el salario a cada valor de cada variable. A continuación, multiplicamos ambos valores y hacemos el sumatorio de los resultados individuales de la multiplicación. La expresión en el denominador garantiza que el coeficiente de correlación se escala entre -1 y 1.

Si multiplicamos dos valores positivos obtenemos un valor positivo. Lo mismo sucede si multiplicamos dos valores negativos (menos por menos es más). Así pues, todos los valores que se sitúan en estos intervalos influyen positivamente en el coeficiente de correlación.

Correlación positiva Correlación Pearson

Si multiplicamos un valor positivo y un valor negativo obtenemos un valor negativo (menos por más es menos). Así que todos los valores que se encuentran en estos rangos tienen una influencia negativa en el coeficiente de correlación.

correlación negativa Correlación de Pearson

Por lo tanto, si nuestros valores están predominantemente en los dos rangos verdes de las imágenes anteriores, obtenemos un coeficiente de correlación positivo y, por lo tanto, una correlación positiva.

Si nuestros valores están predominantemente en las dos zonas rojas de las imágenes, obtenemos un coeficiente de correlación negativo y, por tanto, una correlación negativa.

Si los puntos se distribuyen en las cuatro zonas, los términos positivos y los términos negativos se anulan entre sí y podemos obtener una correlación muy pequeña o nula.

Comprobación de la significación de los coeficientes de correlación

Como norma general, el coeficiente de correlación es calculado a partir de los datos de una muestra. Sin embargo, en la mayoría de los casos queremos probar una hipótesis sobre la población.

Muestra de correlación de Pearson

En el caso del análisis de correlación, queremos saber si existe una correlación en la población.

Para ello, comprobamos si el coeficiente de correlación de la muestra es estadísticamente distinto de cero.

Hipótesis en la correlación de personas

La hipótesis nula y la hipótesis alternativa en la correlación de Pearson son las siguientes

  • Hipótesis nula: El coeficiente de correlación no es significativamente diferente de cero (No existe correlación lineal).
  • Hipótesis alternativa: El coeficiente de correlación se desvía significativamente de cero (Existe una correlación lineal).

Atención: Siempre se comprueba si la hipótesis nula debe ser rechazada o no.

En nuestro ejemplo con el salario y la edad de una persona, podríamos formular la pregunta de la siguiente manera: ¿Existe una correlación entre la edad y el salario en la población alemana (la población)?

Para averiguarlo, extraemos una muestra y comprobamos si el coeficiente de correlación es significativamente distinto de cero en esta muestra.

  • La hipótesis nula es entonces: No existe correlación entre salario y edad en la población alemana.
  • y la hipótesis alternativa: Existe una correlación entre el salario y la edad en la población alemana.

Significación y prueba t

La prueba t permite comprobar si el coeficiente de correlación de Pearson es significativamente distinto de cero a partir de la muestra estudiada. Aquí, r es el coeficiente de correlación y n es el tamaño de la muestra.

Significación de la correlación de Pearson

A continuación, se puede calcular un valor p a partir del estadístico de prueba t. Si el valor p es menor que el nivel de significación especificado, que suele ser del 5%, entonces se rechaza la hipótesis nula, en caso contrario no.

Supuestos de la correlación de Pearson

Pero, ¿qué ocurre con los supuestos de una correlación de Pearson? Aquí tenemos que distinguir si sólo queremos calcular el coeficiente de correlación de Pearson o si queremos probar una hipótesis.

Para calcular el coeficiente de correlación de Pearson, sólo deben estar presentes dos variables métricas. Las variables métricas son, por ejemplo, el peso de una persona, su salario o su consumo de electricidad.

El coeficiente de correlación de Pearson nos indica la magnitud de la correlación lineal. Si existe una correlación no lineal, no podemos leerla en el coeficiente de correlación de Pearson.

Supuestos de la correlación de Pearson

Sin embargo, si queremos comprobar si el coeficiente de correlación de Pearson es significativamente diferente de cero en la muestra, es decir, queremos comprobar una hipótesis, ¡las dos variables también deben estar distribuidas normalmente!

Correlación de Pearson distribución normal

Si esto no se da, el estadístico t calculado o el valor p no pueden interpretarse de forma fiable. Si no se cumplen los requisitos previos, se puede utilizar la correlación de rangos de Spearman.

Calcular la correlación de Pearson online con DATAtab

Si lo deseas, puede calcular un análisis de correlación online con DATAtab. Para ello, simplemente copia tus datos en esta tabla de la calculadora estadística y haga clic en la pestaña Pruebas de hipótesis o Correlación.

Si prestas atención a dos variables métricas, se calculará automáticamente una correlación de Pearson. Si no sabes exactamente cómo interpretar los resultados, también puedes hacer clic en Resumen en palabras.

Cita DATAtab: DATAtab Team (2024). DATAtab: Online Statistics Calculator. DATAtab e.U. Graz, Austria. URL https://datatab.es

Contacto y soporte Preguntas frecuentes y Sobre nosotros Política de privacidad Software estadístico