9.7: Distribución de muestreo de r de Pearson

Última actualización
Guardar como PDF

Page ID: 152455

\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

Objetivos de aprendizaje

Transformar\(r\) a\(z'\)
Calcular la probabilidad de obtener un valor\(r\) por encima de un valor especificado

Supongamos que la correlación entre los puntajes SAT cuantitativos y verbales en una población determinada es\(0.60\). En otras palabras,\(\rho =0.60\). Si\(12\) los estudiantes fueran muestreados aleatoriamente, la correlación muestral\(r\),, no sería exactamente igual a\(0.60\). Naturalmente diferentes muestras de\(12\) estudiantes producirían diferentes valores de\(r\). La distribución de valores de\(r\) después de muestras repetidas de\(12\) estudiantes es la distribución muestral de\(r\).

La forma de la distribución de\(r\) muestreo del ejemplo anterior se muestra en la Figura\(\PageIndex{1}\). Se puede ver que la distribución de muestreo no es simétrica: está sesgada negativamente. La razón del sesgo es que\(r\) no puede tomar valores mayores que\(1.0\) y por lo tanto la distribución no puede extenderse tan lejos en la dirección positiva como puede en la dirección negativa. Cuanto mayor sea el valor de\(\rho\), más pronunciado es el sesgo.

Figura\(\PageIndex{1}\): La distribución muestral de\(r\) para\(N = 12\) y\(\rho =0.60\)

La figura\(\PageIndex{2}\) muestra la distribución de muestreo para\(\rho =0.90\). Esta distribución tiene una cola positiva muy corta y una cola larga negativa.

Figura\(\PageIndex{1}\): La distribución muestral de\(r\) para\(N = 12\) y\(\rho =0.90\)

Refiriéndose de nuevo al ejemplo del SAT, supongamos que quería saber la probabilidad de que en una muestra de\(12\) alumnos, el valor muestral de\(r\) sea\(0.75\) o superior. Se podría pensar que todo lo que necesitaría saber para calcular esta probabilidad es la media y el error estándar de la distribución de muestreo de\(r\). No obstante, dado que la distribución del muestreo no es normal, todavía no se podría resolver el problema. Afortunadamente, el estadístico Fisher desarrolló una forma de transformarse\(r\) a una variable que normalmente se distribuye con un error estándar conocido. Se llama a la variable\(z'\) y a continuación se da la fórmula para la transformación.

\[z' = 0.5\: \ln \frac{1+r}{1-r}\]

Los detalles de la fórmula no son importantes aquí ya que normalmente usarás ya sea una tabla, Pearson r a Fisher z' o calculadora para hacer la transformación. Lo importante es que\(z'\) se distribuya normalmente y tenga un error estándar de

\[\frac{1}{\sqrt{N-3}}\]

donde\(N\) está el número de pares de puntajes.

Ejemplo\(\PageIndex{1}\)

Volvamos a la cuestión de determinar la probabilidad de obtener una correlación muestral de\(0.75\) o superior en una muestra\(12\) de una población con una correlación de\(0.60\).

Solución

El primer paso es convertir ambos\(0.60\) y\(0.75\) a sus\(z'\) valores, que son\(0.693\) y\(0.973\), respectivamente.

El error estándar de\(z'\) for\(N = 12\) es\(0.333\).

Por lo tanto, la pregunta se reduce a lo siguiente: dada una distribución normal con una media de\(0.693\) y una desviación estándar de\(0.333\), ¿cuál es la probabilidad de obtener un valor de\(0.973\) o superior?

La respuesta se puede encontrar directamente desde el applet “Calcular Área para una X dada” a ser\(0.20\).

Alternativamente, podrías usar la fórmula:

\[z = \frac{X - \mu }{\sigma } = \frac{0.973 - 0.693}{0.333} = 0.841\]

y usa una mesa para encontrar que el área de arriba\(0.841\) es\(0.20\).