12.4: r de Pearson
- Page ID
- 150739
Existen varios tipos diferentes de coeficientes de correlación, pero sólo nos centraremos en los más comunes: los de Pearson\(r\). \(r\)es un coeficiente de correlación muy popular para evaluar relaciones lineales, y sirve como estadística descriptiva (like\(\overline{X}\)) y como estadística de prueba (like\(t\)). Es descriptivo porque describe lo que está sucediendo en la gráfica de dispersión;\(r\) tendrá tanto un signo (+/—) para la dirección como un número (0 — 1 en valor absoluto) para la magnitud. Como se señaló anteriormente, asume una relación lineal, así que nada sobre\(r\) sugerirá cuál es la forma —solo dirá cuál sería la dirección y magnitud si la forma es lineal (Recuerda: ¡siempre haz primero una gráfica de dispersión!). \(r\)también funciona como estadística de prueba porque la magnitud de\(r\) corresponderá directamente a un\(t\) valor como los grados específicos de libertad, que luego pueden compararse con un valor crítico. Por suerte, no necesitamos hacer esta conversión a mano. En cambio, tendremos una tabla de valores\(r\) críticos que se ve muy similar a nuestra\(t\) tabla, y podemos comparar nuestra\(r\) directamente con esos.
La fórmula para\(r\) es muy simple: es solo la covarianza (definida anteriormente) dividida por las desviaciones estándar de\(X\) y\(Y\):
\[r=\dfrac{\operatorname{cov}_{X Y}}{s_{X} s_{Y}}=\dfrac{S P}{\sqrt{S S X * S S Y}} \]
La primera fórmula da una idea directa de lo que es una correlación: una covarianza estandarizada en la escala de\(X\) y\(Y\); la segunda fórmula es computacionalmente más simple y rápida. Ambas ecuaciones darán el mismo valor, y como vimos al principio del capítulo, todos estos valores se calculan fácilmente usando la tabla de suma de productos. Cuando hagamos este cálculo, encontraremos que nuestra respuesta siempre está entre -1.00 y 1.00 (si no lo es, vuelve a verificar las matemáticas), lo que nos da una métrica estándar, interpretable, similar a lo que hicieron\(z\) -scores.
Se afirmó anteriormente que\(r\) es una estadística descriptiva como\(\overline{X}\), y al igual que\(\overline{X}\), corresponde a un parámetro poblacional. Para las correlaciones, el parámetro de población es la letra griega minúscula\(ρ\) (“rho”); tenga cuidado de no confundir\(ρ\) con un\(p\) -valor —se ven bastante similares. \(r\)es una estimación de\(ρ\) igual que\(\overline{X}\) es una estimación de\(μ\). Así, probaremos nuestro valor observado del\(r\) que calculamos a partir de los datos y lo compararemos con un valor de\(ρ\) especificado por nuestra hipótesis nula para ver si la relación entre nuestras variables es significativa, como veremos en nuestro ejemplo a continuación.