Saltar al contenido principal
LibreTexts Español

4.12: puntuaciones z

  • Page ID
    150483
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    \( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)

    ( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\id}{\mathrm{id}}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\kernel}{\mathrm{null}\,}\)

    \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\)

    \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\)

    \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    \( \newcommand{\vectorA}[1]{\vec{#1}}      % arrow\)

    \( \newcommand{\vectorAt}[1]{\vec{\text{#1}}}      % arrow\)

    \( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vectorC}[1]{\textbf{#1}} \)

    \( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)

    \( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)

    \( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)

    \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    Ahora estamos en condiciones de combinar algunas de las cosas de las que hemos estado hablando en este capítulo, y presentarte una nueva herramienta, z-scores. Resulta que no usaremos mucho las puntuaciones z en este libro de texto. Sin embargo, no se puede tomar una clase de estadística y no aprender sobre los puntajes z.

    Lo primero que te mostramos parece ser algo que muchos alumnos recuerdan de su clase de estadística. Esto probablemente se recuerde porque los instructores pueden probar este conocimiento muchas veces, por lo que los estudiantes tienen que aprenderlo para la prueba. Echemos un vistazo a esta cosa. Vamos a ver una distribución normal, y vamos a trazar líneas a través de la distribución a 0, +/- 1, +/-2 y +/- 3 desviaciones estándar de la media:

    library(ggplot2)
    dnorm_vec <- dnorm(seq(-5,5,.1),mean=0,sd=1)
    x_range   <- seq(-5,5,.1)
    t_df<-data.frame(x_range,dnorm_vec)
    ggplot(t_df, aes(x=x_range,y=dnorm_vec))+
      geom_line()+
      geom_vline(xintercept = 0)+
      geom_vline(xintercept = c(-3,-2,-1,1,2,3))+
      theme_classic()+
      ylab("Density")+
      xlab("score") +
      scale_x_continuous(breaks=seq(-5,5,1))+
      geom_label(data = data.frame(x=-.5, y=.3,
                label=round(pnorm(c(0,1),0,1)[2]-pnorm(c(0,1),0,1)[1], digits=3)), 
                aes(x = x, y = y, label = label))+
      geom_label(data = data.frame(x=.5, y=.3,
                label=round(pnorm(c(0,1),0,1)[2]-pnorm(c(0,1),0,1)[1], digits=3)), 
                aes(x = x, y = y, label = label))+
        geom_label(data = data.frame(x=-1.5, y=.3,
                label=round(pnorm(c(1,2),0,1)[2]-pnorm(c(1,2),0,1)[1], digits=3)), 
                aes(x = x, y = y, label = label))+
      geom_label(data = data.frame(x=1.5, y=.3,
                label=round(pnorm(c(1,2),0,1)[2]-pnorm(c(1,2),0,1)[1], digits=3)), 
                aes(x = x, y = y, label = label)) + 
      geom_label(data = data.frame(x=-2.5, y=.3,
                label=round(pnorm(c(2,3),0,1)[2]-pnorm(c(2,3),0,1)[1], digits=3)), 
                aes(x = x, y = y, label = label))+
      geom_label(data = data.frame(x=2.5, y=.3,
                label=round(pnorm(c(2,3),0,1)[2]-pnorm(c(2,3),0,1)[1], digits=3)), 
                aes(x = x, y = y, label = label))+ 
      geom_label(data = data.frame(x=-3.5, y=.3,
                label=round(pnorm(c(3,4),0,1)[2]-pnorm(c(3,4),0,1)[1], digits=3)), 
                aes(x = x, y = y, label = label))+
      geom_label(data = data.frame(x=3.5, y=.3,
                label=round(pnorm(c(3,4),0,1)[2]-pnorm(c(3,4),0,1)[1], digits=3)), 
                aes(x = x, y = y, label = label))
    Figura\(\PageIndex{1}\): Una distribución normal. Cada línea representa una desviación estándar de la media. Las etiquetas muestran las proporciones de puntuaciones que caen entre cada barra.

    La figura muestra una distribución normal con media = 0, y desviación estándar = 1. Hemos dibujado líneas en cada una de las desviaciones estándar: -3, -2, -1, 0, 1, 2 y 3. También mostramos algunos números en las etiquetas, entre cada línea. Estos números son proporciones. Por ejemplo, vemos que la proporción es .341 para puntuaciones que caen entre el rango 0 y 1. Los puntajes entre 0 y 1 ocurren 34.1% de las veces. Los puntajes entre -1 y 1, ocurren 68.2% del tiempo, es decir, más de la mitad de los puntajes. Los puntajes entre 1 y ocurren alrededor del 13.6% de las veces, y los puntajes entre 2 y 3 ocurren aún menos, solo 2.1% del tiempo.

    Las distribuciones normales siempre tienen estas propiedades, incluso cuando tienen diferentes medias y desviaciones estándar. Por ejemplo, eche un vistazo a esta distribución normal, tiene una media =100, y una desviación estándar =25.

    library(ggplot2)
    dnorm_vec <- dnorm(seq(0,200,.1),mean=100,sd=25)
    x_range   <- seq(0,200,.1)
    t_df<-data.frame(x_range,dnorm_vec)
    ggplot(t_df, aes(x=x_range,y=dnorm_vec))+
      geom_line()+
      geom_vline(xintercept = 100)+
      geom_vline(xintercept = c(25,50,75,125,150,175))+
      theme_classic()+
      ylab("Density")+
      xlab("score") +
      scale_x_continuous(breaks=seq(0,200,25))+
      geom_label(data = data.frame(x=87.5, y=0.01,
                label=round(pnorm(c(0,1),0,1)[2]-pnorm(c(0,1),0,1)[1], digits=3)), 
                aes(x = x, y = y, label = label))+
      geom_label(data = data.frame(x=112.5, y=0.01,
                label=round(pnorm(c(0,1),0,1)[2]-pnorm(c(0,1),0,1)[1], digits=3)), 
                aes(x = x, y = y, label = label))+
        geom_label(data = data.frame(x=62.5, y=0.01,
                label=round(pnorm(c(1,2),0,1)[2]-pnorm(c(1,2),0,1)[1], digits=3)), 
                aes(x = x, y = y, label = label))+
      geom_label(data = data.frame(x=137.5, y=0.01,
                label=round(pnorm(c(1,2),0,1)[2]-pnorm(c(1,2),0,1)[1], digits=3)), 
                aes(x = x, y = y, label = label)) + 
      geom_label(data = data.frame(x=37.5, y=0.01,
                label=round(pnorm(c(2,3),0,1)[2]-pnorm(c(2,3),0,1)[1], digits=3)), 
                aes(x = x, y = y, label = label))+
      geom_label(data = data.frame(x=162.5, y=0.01,
                label=round(pnorm(c(2,3),0,1)[2]-pnorm(c(2,3),0,1)[1], digits=3)), 
                aes(x = x, y = y, label = label))+ 
      geom_label(data = data.frame(x=12.5, y=0.01,
                label=round(pnorm(c(3,4),0,1)[2]-pnorm(c(3,4),0,1)[1], digits=3)), 
                aes(x = x, y = y, label = label))+
      geom_label(data = data.frame(x=187.5, y=0.01,
                label=round(pnorm(c(3,4),0,1)[2]-pnorm(c(3,4),0,1)[1], digits=3)), 
                aes(x = x, y = y, label = label))
    Figura\(\PageIndex{2}\): Una distribución normal. Cada línea representa una desviación estándar de la media. Las etiquetas muestran las proporciones de puntuaciones que caen entre cada barra.

    Ahora estamos viendo una distribución normal con media = 100 y desviación estándar = 25. Observe que la región entre 100 y 125 contiene 34.1% de las puntuaciones. Esta región está a 1 desviación estándar de la media (la desviación estándar es 25, la media es 100, por lo que 25 está a una desviación estándar completa de 100). Como puede ver, las mismas proporciones ocurren entre cada una de las desviaciones estándar, como lo hicieron cuando nuestra desviación estándar se fijó en 1 (con una media de 0).

     

    Idea detrás de las puntuaciones z

    A veces puede ser conveniente transformar tus partituras originales en diferentes partituras con las que sea más fácil trabajar. Por ejemplo, si tienes un montón de proporciones, como .3, .5, .6, .7, tal vez quieras convertirlas en porcentajes como 30%, 50%, 60% y 70%. Para ello multiplicas las proporciones por una constante de 100. Si quieres volver a convertir los porcentajes en proporciones, divides por una constante de 100. Este tipo de transformación solo cambia la escala de los números de entre 0-1, y entre 0-100. De lo contrario, el patrón en los números permanece igual.

    La idea detrás de las puntuaciones z es un tipo similar de transformación. La idea es expresar cada puntaje bruto en términos de su desviación estándar. Por ejemplo, si te dijera que obtuve un 75% en la prueba, no sabrías qué tan bien lo hice en comparación con el resto de la clase. Pero, si te dijera que anoté 2 desviaciones estándar por encima de la media, sabrías que lo hice bastante bien en comparación con el resto de la clase, porque sabes que la mayoría de las puntuaciones (si se distribuyen normalmente) caen por debajo de las 2 desviaciones estándar de la media.

    También sabemos, ahora gracias al teorema del límite central, que muchas de nuestras medidas, como las medias muestrales, se distribuirán normalmente. Por lo tanto, a menudo puede ser deseable expresar los puntajes brutos en términos de sus desviaciones estándar.

    Veamos cómo se ve esto en una tabla sin mostrarte ninguna fórmula. Veremos algunas puntuaciones que provienen de una distribución normal con media =100, y desviación estándar = 25. Vamos a enumerar algunas puntuaciones en bruto, junto con las puntuaciones z

    crudo z
    25 -3
    50 -2
    75 -1
    100 0
    125 1
    150 2
    175 3

    Recuerde, la media es 100, y la desviación estándar es 25. ¿Cuántas desviaciones estándar alejadas de la media es una puntuación de 100? La respuesta es 0, está justo en la media. Se puede ver la puntuación z para 100, es 0. ¿Cuántas desviaciones estándar está a 125 de la media? Bueno la desviación estándar es 25, 125 es un todo 25 lejos de 100, eso es un total de 1 desviación estándar, por lo que la puntuación z para 125 es 1. El puntaje z para 150 es 2, porque 150 está a dos 25s de distancia de 100. El puntaje z para 50 es -2, porque 50 está a dos 25s de distancia de 100 en sentido contrario. Todo lo que estamos haciendo aquí es reexpresar los puntajes brutos en términos de cuántas desviaciones estándar son de la media. Recuerde, la media siempre es correcta en el objetivo, por lo que el centro de la distribución de puntuación z siempre es 0.

     

    Cálculo de puntuaciones z

    Para calcular las puntuaciones z todo lo que tienes que hacer es averiguar cuántas desviaciones estándar de la media es cada número. Digamos que la media es 100, y la desviación estándar es 25. Tienes una puntuación de 97. ¿Cuántas desviaciones estándar de la media es 97?

    Primero computa la diferencia entre la puntuación y la media:

    \[97-100 = -3 \nonumber \]

    Bien, tenemos una diferencia total de -3. ¿Cuántas desviaciones estándar representa -3 si 1 desviación estándar es 25? Claramente -3 es mucho menor que 25, por lo que va a ser mucho menor que 1. Para resolverlo, solo divida -3 por la desviación estándar.

    \[\frac{-3}{25} = -.12 \nonumber \]

    Nuestro puntaje z para 97 es -.12.

    Aquí está la fórmula general:

    \[z = \frac{\text{raw score} - \text{mean}}{\text{standard deviation}} \nonumber\]

    Entonces, por ejemplo, si tuviéramos estos 10 puntajes de una distribución normal con media = 100, y desviación estándar =25

    72.23  73.48  96.25  91.60  56.84 105.56 128.96  91.33  70.96 120.23
    

    Los puntajes z serían:

    -1.1108 -1.0608 -0.1500 -0.3360 -1.7264  0.2224  1.1584 -0.3468
    -1.1616  0.8092
    

    Una vez que tengas las puntuaciones z, podrías usarlas como otra forma de describir tus datos. Por ejemplo, ahora con solo mirar una puntuación sabes si es probable o poco probable que ocurra, porque sabes cómo funciona el área bajo la curva normal. Las puntuaciones z entre -1 y 1 ocurren con bastante frecuencia, las puntuaciones mayores que 1 o -1 siguen sucediendo con bastante frecuencia, pero no con tanta frecuencia. Y, puntajes mayores a 2 o -2 no ocurren muy a menudo. Esto es algo conveniente de hacer si quieres mirar tus números y tener una idea general de la frecuencia con la que ocurren.

    Por lo general, no conoces la media o la desviación estándar de la población de la que estás sacando tus puntajes muestrales. Entonces, podrías usar la media y la desviación estándar de tu muestra como estimación, y luego usarlas para calcular las puntuaciones z.

    Finalmente, las puntuaciones z también se denominan puntuaciones estandarizadas, porque cada puntaje bruto se describe en términos de su desviación estándar. Esta bien puede ser la última vez que hablamos de z-scores en este libro. Quizás te preguntes por qué incluso nos molestamos en contarte sobre ellos. Primero, vale la pena saber que son una cosa. Segundo, se vuelven importantes a medida que tu destreza estadística se vuelve más avanzada. En tercer lugar, algunos conceptos estadísticos, como la correlación, pueden reescribirse en términos de puntuaciones z, y esto ilumina aspectos de esas estadísticas. Por último, son súper útiles cuando se trata de una distribución normal que tiene una media y desviación estándar conocidas.


    This page titled 4.12: puntuaciones z is shared under a CC BY-SA 4.0 license and was authored, remixed, and/or curated by Matthew J. C. Crump via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.