Saltar al contenido principal
LibreTexts Español

7.1: Correlación

  • Page ID
    149568
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    En muchos estudios, medimos más de una variable para cada individuo. Por ejemplo, medimos la precipitación y el crecimiento de las plantas, o el número de jóvenes con hábitat de anidación, o la erosión del suelo y el volumen de agua. Recopilamos pares de datos y en lugar de examinar cada variable por separado (datos univariados), queremos encontrar formas de describir datos bivariados, en los que se midan dos variables sobre cada sujeto de nuestra muestra. Dados estos datos, comenzamos por determinar si existe una relación entre estas dos variables. A medida que cambian los valores de una variable, ¿vemos los cambios correspondientes en la otra variable?

    Podemos describir la relación entre estas dos variables gráfica y numéricamente. Comenzamos por considerar el concepto de correlación.

    Definición: Correlación

    La correlación se define como la asociación estadística entre dos variables.

    Existe una correlación entre dos variables cuando una de ellas está relacionada de alguna manera con la otra. Una gráfica de dispersión es el mejor lugar para comenzar. Un diagrama de dispersión (o diagrama de dispersión) es un gráfico de los datos de muestra emparejados (x, y) con un eje x horizontal y un eje y vertical. Cada par individual (x, y) se traza como un solo punto.

    11280.png

    Figura 1. Gráfica de dispersión de circunferencia torácica versus longitud.

    En este ejemplo, trazamos la circunferencia del pecho del oso (y) contra la longitud del oso (x). Al examinar una gráfica de dispersión, debemos estudiar el patrón general de los puntos trazados. En este ejemplo, vemos que el valor de la circunferencia torácica tiende a aumentar a medida que aumenta el valor de la longitud. Podemos ver una pendiente ascendente y un patrón de línea recta en los puntos de datos trazados.

    Una gráfica de dispersión puede identificar varios tipos diferentes de relaciones entre dos variables.

    • Una relación no tiene correlación cuando los puntos de una gráfica de dispersión no muestran ningún patrón.
    • Una relación no es lineal cuando los puntos de una gráfica de dispersión siguen un patrón pero no una línea recta.
    • Una relación es lineal cuando los puntos de una gráfica de dispersión siguen un patrón de línea algo recta. Esta es la relación que vamos a examinar.

    Las relaciones lineales pueden ser positivas o negativas. Las relaciones positivas tienen puntos que se inclinan hacia arriba hacia la derecha. A medida que aumentan los valores x, y los valores aumentan. A medida que los valores de x disminuyen, y los valores disminuyen. Por ejemplo, al estudiar plantas, la altura suele aumentar a medida que aumenta el diámetro.

    11268.png

    Figura 2. Gráfica de dispersión de altura versus diámetro.

    Las relaciones negativas tienen puntos que disminuyen hacia abajo hacia la derecha. A medida que aumentan los valores x, y los valores disminuyen. A medida que los valores de x disminuyen, y los valores aumentan. Por ejemplo, a medida que aumenta la velocidad del viento, la temperatura del viento disminuye.

    11256.png

    Figura 3. Gráfica de dispersión de temperatura versus velocidad del viento.

    Las relaciones no lineales tienen un patrón aparente, simplemente no lineal. Por ejemplo, a medida que aumenta la edad, la altura aumenta hasta un punto luego se nivela después de alcanzar una altura máxima.

    11245.png

    Figura 4. Gráfica de dispersión de altura versus edad.

    Cuando dos variables no tienen relación, no hay relación de línea recta o relación no lineal. Cuando una variable cambia, no influye en la otra variable.

    11236.png

    Figura 5. Gráfica de dispersión de crecimiento versus área.

    Coeficiente de correlación lineal

    Debido a que los exámenes visuales son en gran parte subjetivos, necesitamos una medida más precisa y objetiva para definir la correlación entre las dos variables. Para cuantificar la fuerza y dirección de la relación entre dos variables, se utiliza el coeficiente de correlación lineal:

    \[r = \dfrac {\sum \dfrac {(x_i-\bar x)}{s_x} \dfrac {(y_i - \bar y)}{s_y}}{n-1}\]

    donde\(\bar x\) y\(s_x\) son la media de la muestra y la desviación estándar de la muestra de las x,\(\bar y\) y\(s_y\) son la media y desviación estándar de las y.

    Un cálculo alternativo del coeficiente de correlación es:

    \[r = \dfrac {S_{xy}}{\sqrt {S_{xx}S_{yy}}}\]

    donde

    $$S_ {xx} =\ suma x^2 -\ dfrac {(\ suma x) ^2} {n}\]

    $$S_ {xy} =\ sum xy -\ dfrac {(\ sum x) (\ sum y)} {n}\]

    $$S_ {yy} =\ suma y^2 -\ dfrac {(\ suma x) ^2} {n}\]

    El coeficiente de correlación lineal también se conoce como coeficiente de correlación de momento producto de Pearson en honor a Karl Pearson, quien originalmente lo desarrolló. Esta estadística describe numéricamente cuán fuerte es la relación lineal o recta entre las dos variables y la dirección, positiva o negativa.

    Las propiedades de “r”:

    • Siempre está entre -1 y +1.
    • Es una medida sin unidades por lo que “r” sería el mismo valor ya sea que midiera las dos variables en libras y pulgadas o en gramos y centímetros.
    • Los valores positivos de “r” están asociados con relaciones positivas.
    • Los valores negativos de “r” están asociados con relaciones negativas.

    Ejemplos de Correlación Positiva

    11215.png

    Figura 6. Ejemplos de correlación positiva.

    Ejemplos de Correlación Negativa

    11205.png

    Figura 7. Ejemplos de correlación negativa.

    Nota

    La correlación no es causalidad!!! El hecho de que dos variables estén correlacionadas no significa que una variable haga que otra variable cambie.

    Examine estos dos diagramas de dispersión siguientes. Ambos conjuntos de datos tienen un r = 0.01, pero son muy diferentes. La gráfica 1 muestra poca relación lineal entre las variables x e y. La gráfica 2 muestra una fuerte relación no lineal. El coeficiente de correlación lineal de Pearson solo mide la fuerza y dirección de una relación lineal. Ignorar la gráfica de dispersión podría resultar en un grave error al describir la relación entre dos variables.

    11196.png

    Figura 8. Comparación de diagramas de dispersión.

    Cuando investigues la relación entre dos variables, siempre comienza con una gráfica de dispersión. Esta gráfica permite buscar patrones (tanto lineales como no lineales). El siguiente paso es describir cuantitativamente la fuerza y dirección de la relación lineal usando “r”. Una vez que haya establecido que existe una relación lineal, puede dar el siguiente paso en la construcción de modelos.


    This page titled 7.1: Correlación is shared under a CC BY-NC-SA 3.0 license and was authored, remixed, and/or curated by Diane Kiernan (OpenSUNY) via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.