12.4: r de Pearson

Última actualización
Guardar como PDF

Page ID: 150739

Foster et al.
University of Missouri-St. Louis, Rice University, & University of Houston, Downtown Campus via University of Missouri’s Affordable and Open Access Educational Resources Initiative

\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

Existen varios tipos diferentes de coeficientes de correlación, pero sólo nos centraremos en los más comunes: los de Pearson\(r\). \(r\)es un coeficiente de correlación muy popular para evaluar relaciones lineales, y sirve como estadística descriptiva (like\(\overline{X}\)) y como estadística de prueba (like\(t\)). Es descriptivo porque describe lo que está sucediendo en la gráfica de dispersión;\(r\) tendrá tanto un signo (+/—) para la dirección como un número (0 — 1 en valor absoluto) para la magnitud. Como se señaló anteriormente, asume una relación lineal, así que nada sobre\(r\) sugerirá cuál es la forma —solo dirá cuál sería la dirección y magnitud si la forma es lineal (Recuerda: ¡siempre haz primero una gráfica de dispersión!). \(r\)también funciona como estadística de prueba porque la magnitud de\(r\) corresponderá directamente a un\(t\) valor como los grados específicos de libertad, que luego pueden compararse con un valor crítico. Por suerte, no necesitamos hacer esta conversión a mano. En cambio, tendremos una tabla de valores\(r\) críticos que se ve muy similar a nuestra\(t\) tabla, y podemos comparar nuestra\(r\) directamente con esos.

La fórmula para\(r\) es muy simple: es solo la covarianza (definida anteriormente) dividida por las desviaciones estándar de\(X\) y\(Y\):

\[r=\dfrac{\operatorname{cov}_{X Y}}{s_{X} s_{Y}}=\dfrac{S P}{\sqrt{S S X * S S Y}} \]

La primera fórmula da una idea directa de lo que es una correlación: una covarianza estandarizada en la escala de\(X\) y\(Y\); la segunda fórmula es computacionalmente más simple y rápida. Ambas ecuaciones darán el mismo valor, y como vimos al principio del capítulo, todos estos valores se calculan fácilmente usando la tabla de suma de productos. Cuando hagamos este cálculo, encontraremos que nuestra respuesta siempre está entre -1.00 y 1.00 (si no lo es, vuelve a verificar las matemáticas), lo que nos da una métrica estándar, interpretable, similar a lo que hicieron\(z\) -scores.

Se afirmó anteriormente que\(r\) es una estadística descriptiva como\(\overline{X}\), y al igual que\(\overline{X}\), corresponde a un parámetro poblacional. Para las correlaciones, el parámetro de población es la letra griega minúscula\(ρ\) (“rho”); tenga cuidado de no confundir\(ρ\) con un\(p\) -valor —se ven bastante similares. \(r\)es una estimación de\(ρ\) igual que\(\overline{X}\) es una estimación de\(μ\). Así, probaremos nuestro valor observado del\(r\) que calculamos a partir de los datos y lo compararemos con un valor de\(ρ\) especificado por nuestra hipótesis nula para ver si la relación entre nuestras variables es significativa, como veremos en nuestro ejemplo a continuación.