Saltar al contenido principal
LibreTexts Español

13.2: Prueba de la significancia del coeficiente de correlación

  • Page ID
    151040
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    El coeficiente de correlación\(r\),, nos habla de la fuerza y dirección de la relación lineal entre\(X_1\) y\(X_2\).

    Los datos de la muestra se utilizan para calcular\(r\), el coeficiente de correlación para la muestra. Si tuviéramos datos para toda la población, podríamos encontrar el coeficiente de correlación poblacional. Pero como solo tenemos datos de muestra, no podemos calcular el coeficiente de correlación poblacional. El coeficiente de correlación muestral, r, es nuestra estimación del coeficiente de correlación poblacional desconocida.

    • La prueba de hipótesis nos permite decidir si el valor del coeficiente de correlación poblacional\ rho es “cercano a cero” o “significativamente diferente de cero”. Esto lo decidimos con base en el coeficiente de correlación muestral\(r\) y el tamaño de la muestra\(n\).

      Si la prueba concluye que el coeficiente de correlación es significativamente diferente de cero, decimos que el coeficiente de correlación es “significativo”.

      • Qué significan las hipótesis en palabras
        • Sacando una conclusión Existen dos métodos para tomar la decisión respecto a la hipótesis. El estadístico de prueba para probar esta hipótesis es:

          \[t_{c}=\frac{r}{\sqrt{\left(1-r^{2}\right) /(n-2)}}\nonumber\]

          \[t_{c}=\frac{r \sqrt{n-2}}{\sqrt{1-r^{2}}}\nonumber\]

          Donde la segunda fórmula es una forma equivalente del estadístico de prueba,\(n\) es el tamaño de la muestra y los grados de libertad son\(n-2\). Este es un\(t\) -estadístico y opera de la misma manera que otras\(t\) pruebas. Calcule el\(t\) valor -y compárelo con el valor crítico de la\(t\) tabla -en los grados de libertad apropiados y el nivel de confianza que desea mantener. Si el valor calculado está en la cola entonces no puede aceptar la hipótesis nula de que no existe una relación lineal entre estas dos variables aleatorias independientes. Si el\(t\) valor calculado NO está en la cola entonces no puede rechazar la hipótesis nula de que no existe una relación lineal entre las dos variables.

          Una manera rápida de probar correlaciones es la relación entre el tamaño de la muestra y la correlación. Si:

          \[|r| \geq \frac{2}{\sqrt{n}}\nonumber\]

          entonces esto implica que la correlación entre las dos variables demuestra que existe una relación lineal y es estadísticamente significativa en aproximadamente el nivel 0.05 de significancia. Como indica la fórmula, existe una relación inversa entre el tamaño de la muestra y la correlación requerida para la significación de una relación lineal. Con solo 10 observaciones, la correlación requerida para significancia es 0.6325, para 30 observaciones la correlación requerida para significancia disminuye a 0.3651 y a 100 observaciones el nivel requerido es solo 0.2000.

          Las correlaciones pueden ser útiles para visualizar los datos, pero no se utilizan adecuadamente para “explicar” una relación entre dos variables. Quizás ningún estadístico es más mal utilizado que el coeficiente de correlación. Citando correlaciones entre las condiciones de salud y todo, desde el lugar de residencia hasta el color de ojos, tiene el efecto de implicar una relación de causa y efecto. Esto simplemente no se puede lograr con un coeficiente de correlación. El coeficiente de correlación es, por supuesto, inocente de esta mala interpretación. Es deber del analista utilizar una estadística que esté diseñada para probar las relaciones de causa y efecto y reportar únicamente esos resultados si tienen la intención de hacer tal afirmación. El problema es que pasar esta prueba más rigurosa es difícil así que los “investigadores” perezosos y/o sin escrúpulos retroceden en las correlaciones cuando no pueden hacer su caso legítimamente.


    This page titled 13.2: Prueba de la significancia del coeficiente de correlación is shared under a CC BY 4.0 license and was authored, remixed, and/or curated by OpenStax via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.