Saltar al contenido principal
Library homepage
 
LibreTexts Español

4.5: Computación r

  • Page ID
    152429
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Objetivos de aprendizaje

    • Definir\(X\) y\(x\)
    • Indicar por qué\(\sum xy=0\) cuando no hay relación
    • Calcular\(r\)

    Existen varias fórmulas que se pueden utilizar para calcular la correlación de Pearson. Algunas fórmulas tienen más sentido conceptual mientras que otras son más fáciles de calcular realmente. Vamos a comenzar con una fórmula que tenga más sentido conceptual.

    Vamos a calcular la correlación entre las variables\(X\) y\(Y\) se muestra en la Tabla\(\PageIndex{1}\). Comenzamos calculando la media para\(X\) y restando esta media de todos los valores de\(X\). La nueva variable se llama "\(x\)”. La variable "\(y\)" se calcula de manera similar. Las variables\(x\) y\(y\) se dice que son puntuaciones de desviación porque cada puntaje es una desviación de la media. Observe que los medios de\(x\) y\(y\) son ambos\(0\). A continuación creamos una nueva columna multiplicando\(x\) y\(y\).

    Antes de continuar con los cálculos, consideremos por qué la suma de la\(xy\) columna revela la relación entre\(X\) y\(Y\). Si no hubiera relación entre\(X\) y\(Y\), entonces los valores positivos de\(x\) tendrían la misma probabilidad de ser emparejados con valores negativos\(y\) como con valores positivos. Esto haría que los valores negativos fueran\(xy\) tan probables como los positivos y la suma sería pequeña. Por otro lado, considere el Cuadro 1 en el que los valores altos de\(X\) se asocian con valores altos de\(Y\) y valores bajos de\(X\) se asocian con valores bajos de\(Y\). Se puede ver que los valores positivos de\(x\) están asociados con valores positivos de\(y\) y los valores negativos de\(x\) se asocian con valores negativos de\(y\). En todos los casos, el producto de\(x\) y\(y\) es positivo, resultando en un total alto para la\(xy\) columna. Finalmente, si hubiera una relación negativa entonces los valores positivos de se\(x\) asociarían con valores negativos de\(y\) y los valores negativos de se\(x\) asociarían con valores positivos de\(y\). Esto conduciría a valores negativos para\(xy\).

    \ (\ PageIndex {1}\): Cálculo de\(r\) “>
    Tabla\(\PageIndex{1}\): Cálculo de\(r\)
    X Y x y xy x 2 y 2
    1 4 -3 -5 15 9 25
    3 6 -1 -3 3 1 9
    5 10 1 1 1 1 1
    5 12 1 3 3 1 9
    6 13 2 4 8 4 16
    Total 20 45 0 0 30 16 60
    Media 4 9 0 0 6

    Pearson's\(r\) está diseñado para que la correlación entre la altura y el peso sea la misma ya sea que la altura se mida en pulgadas o en pies. Para lograr esta propiedad, la correlación de Pearson se calcula dividiendo la suma de la\(xy\) columna (\(\sum xy\)) por la raíz cuadrada del producto de la suma de la\(x^2\) columna (\(\sum x^2\)) y la suma de la\(y^2\) columna (\(\sum y^2\)). La fórmula resultante es:

    \[r=\dfrac{\sum xy}{\sqrt{\sum x^2\sum y^2}}\]

    y por lo tanto

    \[r=\dfrac{30}{\sqrt{(16)(60)}}=\dfrac{30}{\sqrt{960}}=\dfrac{30}{30.984}=0.968\]

    Una fórmula computacional alternativa que evita el paso de calcular las puntuaciones de desviación es:

    \[r=\dfrac{\sum XY-\dfrac{\sum X\sum Y}{N}}{\sqrt{\left ( \sum X^2-\dfrac{\left ( \sum X \right )^2}{N} \right )}\sqrt{\left ( \sum Y^2-\dfrac{\left ( \sum Y \right )^2}{N} \right )}}\]


    This page titled 4.5: Computación r is shared under a Public Domain license and was authored, remixed, and/or curated by David Lane via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.