# 10.2: El coeficiente de correlación lineal

Objetivos de aprendizaje

Aprender qué es el coeficiente de correlación lineal, cómo calcularlo y qué nos dice sobre la relación entre dos variables$$x$$ y$$y$$

La figura$$\PageIndex{1}$$ ilustra las relaciones lineales entre dos variables$$x$$ y$$y$$ de intensidades variables. Es visualmente evidente que en la situación en el panel (a),$$x$$ podría servir como predictor útil de$$y$$, sería menos útil en la situación ilustrada en el panel (b), y en la situación del panel (c) la relación lineal es tan débil como para ser prácticamente inexistente. El coeficiente de correlación lineal es un número calculado directamente a partir de los datos que mide la fuerza de la relación lineal entre las dos variables$$x$$ y$$y$$.

Definición: coeficiente de correlación lineal

El coeficiente de correlación lineal para una colección de$$n$$ pares$$x$$ de números en una muestra es el número$$r$$ dado por la fórmula

El coeficiente de correlación lineal tiene las siguientes propiedades, ilustradas en la Figura$$\PageIndex{2}$$

1. El valor de las$$r$$ mentiras entre$$−1$$ y$$1$$, inclusivo.
2. El signo de$$r$$ indica la dirección de la relación lineal entre$$x$$ y$$y$$:
3. El tamaño de$$|r|$$ indica la fuerza de la relación lineal entre$$x$$ y$$y$$:
1. Si$$|r|$$ está cerca$$1$$ (es decir, si$$r$$ está cerca de cualquiera$$1$$ o$$−1$$), entonces la relación lineal entre$$x$$ y$$y$$ es fuerte.
2. Si$$|r|$$ está cerca$$0$$ (es decir, si$$r$$ está cerca$$0$$ y de cualquier signo). entonces la relación lineal entre$$x$$ y$$y$$ es débil.

para que

$r= \dfrac{SS_{xy}}{\sqrt{SS_{xx}SS_{yy}}}=\dfrac{2.44.583}{\sqrt{(46.916)(1690.916)}}=0.868$

El número cuantifica lo que es visualmente aparente a partir de$$\PageIndex{2}$$ los pesos de las figuras tiende a aumentar linealmente con la altura ($$r$$es positivo) y aunque la relación no es perfecta, es razonablemente fuerte ($$r$$está cerca$$1$$).

Ejemplo$$\PageIndex{1}$$

Calcular el coeficiente de correlación lineal para los pares altura y peso trazados en la Figura$$\PageIndex{2}$$.

Solución:

Incluso para conjuntos de datos pequeños como este, los cálculos son demasiado largos para hacerlos completamente a mano. En la práctica real los datos se ingresan en una calculadora o computadora y se utiliza un programa de estadísticas. Para aclarar el significado de las fórmulas mostraremos los datos y las cantidades relacionadas en forma tabular. Para cada

$$x$$ $$y$$ $$x^2$$ $$y^2$$
68 \ (x\) ">151 \ (y\) ">4624 \ (x^2\) ">10268 \ (y^2\) ">22801
69 \ (x\) ">146 \ (y\) ">4761 \ (x^2\) ">10074 \ (y^2\) ">21316
70 \ (x\) ">157 \ (y\) ">4900 \ (x^2\) ">10990 \ (y^2\) ">24649
70 \ (x\) ">164 \ (y\) ">4900 \ (x^2\) ">11480 \ (y^2\) ">26896
71 \ (x\) ">171 \ (y\) ">5041 \ (x^2\) ">12141 \ (y^2\) ">29241
72 \ (x\) ">160 \ (y\) ">5184 \ (x^2\) ">11520 \ (y^2\) ">25600
72 \ (x\) ">163 \ (y\) ">5184 \ (x^2\) ">11736 \ (y^2\) ">26569
72 \ (x\) ">180 \ (y\) ">5184 \ (x^2\) ">12960 \ (y^2\) ">32400
73 \ (x\) ">170 \ (y\) ">5329 \ (x^2\) ">12410 \ (y^2\) ">28900
73 \ (x\) ">175 \ (y\) ">5329 \ (x^2\) ">12775 \ (y^2\) ">30625
74 \ (x\) ">178 \ (y\) ">5476 \ (x^2\) ">13172 \ (y^2\) ">31684
75 \ (x\) ">188 \ (y\) ">5625 \ (x^2\) ">14100 \ (y^2\) ">35344
859 \ (x\) ">2003 \ (y\) ">61537 \ (x^2\) ">143626 \ (y^2\) ">336025

Llave para llevar

• El coeficiente de correlación lineal mide la fuerza y dirección de la relación lineal entre dos variables$$x$$ y$$y$$.
• El signo del coeficiente de correlación lineal indica la dirección de la relación lineal entre$$x$$ y$$y$$.
• Cuando$$r$$ está cerca$$1$$ o$$−1$$ la relación lineal es fuerte; cuando está cerca$$0$$ la relación lineal es débil.