Saltar al contenido principal
LibreTexts Español

12.1: Variabilidad y Covarianza

  • Page ID
    150763
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Debido a que tenemos dos variables continuas, tendremos dos características o puntuación en la que variarán las personas. Lo que queremos saber es que la gente varía en las puntuaciones juntas. Es decir, a medida que cambia una puntuación, ¿la otra puntuación también cambia de manera predecible o consistente? Esta noción de variables que difieren entre sí se llama covarianza (el prefijo “co” significa “juntas”).

    Veamos nuestra fórmula para la varianza en una sola variable:

    \[s^{2}=\dfrac{\sum(X-\overline{X})^{2}}{N-1} \]

    Usamos\(X\) para representar la puntuación de una persona en la variable en cuestión, y\(\overline{X}\) para representar la media de esa variable. El numerador de esta fórmula es la Suma de Cuadrados, que hemos visto varias veces para diversos usos. Recordemos que cuadrar un valor es simplemente multiplicar ese valor por sí mismo. Así, podemos escribir la misma ecuación que:

    \[s^{2}=\dfrac{\sum((X-\overline{X})(X-\overline{X}))}{N-1} \]

    Esta es la misma fórmula y funciona de la misma manera que antes, donde multiplicamos la puntuación de desviación por sí misma (la cuadramos) y luego sumamos a través de desviaciones cuadradas.

    Ahora, veamos la fórmula para la covarianza. En esta fórmula, todavía usaremos\(X\) para representar la puntuación en una variable, y ahora usaremos\(Y\) para representar la puntuación en la segunda variable. Todavía usaremos barras para representar promedios de los puntajes. La fórmula para la covarianza (\(cov_{X Y}\)con el subíndice\(XY\) para indicar la covarianza entre las\(Y\) variables\(X\) y) es:

    \[\operatorname{cov}_{X Y}=\dfrac{\sum((X-\overline{X})(Y-\overline{Y}))}{N-1} \]

    Como podemos ver, esta es exactamente la misma estructura que la fórmula anterior. Ahora, en lugar de multiplicar el puntaje de desviación por sí mismo sobre una variable, tomamos las puntuaciones de desviación de una sola persona en cada variable y las multiplicamos juntas. Hacemos esto para cada persona (exactamente lo mismo que hicimos para varianza) y luego los sumamos para obtener nuestro numerador. El numerador en esto se llama la Suma de Productos.

    \[S P=\sum((X-\overline{X})(Y-\overline{Y})) \]

    Calcularemos la suma de productos usando la misma tabla que usamos para calcular la suma de cuadrados. De hecho, la tabla para suma de productos es simplemente una tabla de suma de cuadrados para\(X\), más una tabla de suma de cuadrados para\(Y\), con una columna final de productos, como se muestra a continuación.

    Tabla\(\PageIndex{1}\): Tabla Suma de Productos
    \(X\) \((X-\overline{X})\) \((X-\overline{X})^2\) \(Y\) \((Y-\overline{Y})\) \((Y-\overline{Y})^2\) \((X-\overline{X})(Y-\overline{Y})\)
    \ (X\)” style="vertical-align:middle; "> \ ((X-\ overline {X})\)” style="vertical-align:middle; "> \ ((X-\ overline {X}) ^2\)” style="vertical-align:middle; "> \ (Y\)” style="vertical-align:middle; "> \ ((Y-\ overline {Y})\)” style="vertical-align:middle; "> \ ((Y-\ overline {Y}) ^2\)” style="vertical-align:middle; "> \ ((X-\ overline {X}) (Y-\ overline {Y})\)” style="vertical-align:middle; ">
    \ (X\)” style="vertical-align:middle; "> \ ((X-\ overline {X})\)” style="vertical-align:middle; "> \ ((X-\ overline {X}) ^2\)” style="vertical-align:middle; "> \ (Y\)” style="vertical-align:middle; "> \ ((Y-\ overline {Y})\)” style="vertical-align:middle; "> \ ((Y-\ overline {Y}) ^2\)” style="vertical-align:middle; "> \ ((X-\ overline {X}) (Y-\ overline {Y})\)” style="vertical-align:middle; ">
    \ (X\)” style="vertical-align:middle; "> \ ((X-\ overline {X})\)” style="vertical-align:middle; "> \ ((X-\ overline {X}) ^2\)” style="vertical-align:middle; "> \ (Y\)” style="vertical-align:middle; "> \ ((Y-\ overline {Y})\)” style="vertical-align:middle; "> \ ((Y-\ overline {Y}) ^2\)” style="vertical-align:middle; "> \ ((X-\ overline {X}) (Y-\ overline {Y})\)” style="vertical-align:middle; ">
    \ (X\)” style="vertical-align:middle; "> \ ((X-\ overline {X})\)” style="vertical-align:middle; "> \ ((X-\ overline {X}) ^2\)” style="vertical-align:middle; "> \ (Y\)” style="vertical-align:middle; "> \ ((Y-\ overline {Y})\)” style="vertical-align:middle; "> \ ((Y-\ overline {Y}) ^2\)” style="vertical-align:middle; "> \ ((X-\ overline {X}) (Y-\ overline {Y})\)” style="vertical-align:middle; ">

    Esta tabla funciona de la misma manera que antes (recuerda que los encabezados de columna te dicen exactamente qué hacer en esa columna). Enumeramos nuestros datos brutos para las\(Y\) variables\(X\)\(X\) y en las\(Y\) columnas y, respectivamente, luego los sumamos para que podamos calcular la media de cada variable. Luego tomamos esas medias y las restamos del puntaje bruto apropiado para obtener nuestras puntuaciones de desviación para cada persona en cada variable, y las columnas de puntuaciones de desviación sumarán a cero. Cuadraremos nuestras puntuaciones de desviación para cada variable para obtener la suma de cuadrados para\(X\) y para que\(Y\) podamos calcular la varianza y desviación estándar de cada una (usaremos la desviación estándar en nuestra ecuación a continuación). Finalmente, tomamos la puntuación de desviación de cada variable y las multiplicamos juntas para obtener nuestra puntuación de producto. Sumando esta columna nos dará nuestra suma de productos. Es muy importante que multipliques las puntuaciones de desviación en bruto de cada variable, NO las puntuaciones de desviación cuadrada.

    Nuestra suma de productos irá al numerador de nuestra fórmula de covarianza, y luego sólo tenemos que dividirnos por\(N – 1\) para obtener nuestra covarianza. A diferencia de la suma de cuadrados, tanto nuestra suma de productos como nuestra covarianza pueden ser positivas, negativas o cero, y siempre coincidirán (por ejemplo, si nuestra suma de productos es positiva, nuestra covarianza siempre será positiva). Una suma positiva de productos y covarianza indica que las dos variables están relacionadas y se mueven en la misma dirección. Es decir, a medida que una variable sube, la otra también va a subir, y viceversa. Una suma negativa de productos y covarianza significa que las variables están relacionadas pero se mueven en direcciones opuestas cuando cambian, lo que se denomina relación inversa. En una relación inversa, a medida que una variable sube, la otra variable baja. Si la suma de productos y la covarianza son cero, entonces eso significa que las variables no están relacionadas. A medida que una variable sube o baja, la otra variable no cambia de manera consistente o predecible.

    El párrafo anterior nos lleva a una definición importante sobre las relaciones entre variables. Lo que buscamos en una relación es un patrón consistente o predecible. Es decir, las variables cambian juntas, ya sea en la misma dirección o direcciones opuestas, de la misma manera cada vez. No importa si esta relación es positiva o negativa, solo que no es cero. Si no hay consistencia en cómo cambian las variables dentro de una persona, entonces la relación es cero y no existe. Volveremos a revisar esta noción de dirección vs relación cero más adelante.


    This page titled 12.1: Variabilidad y Covarianza is shared under a CC BY-NC-SA 4.0 license and was authored, remixed, and/or curated by Foster et al. (University of Missouri’s Affordable and Open Access Educational Resources Initiative) via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.