5.6: Puntajes estándar
- Page ID
- 151523
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)
( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\id}{\mathrm{id}}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\kernel}{\mathrm{null}\,}\)
\( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\)
\( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\)
\( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)
\( \newcommand{\vectorA}[1]{\vec{#1}} % arrow\)
\( \newcommand{\vectorAt}[1]{\vec{\text{#1}}} % arrow\)
\( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vectorC}[1]{\textbf{#1}} \)
\( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)
\( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)
\( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\(\newcommand{\avec}{\mathbf a}\) \(\newcommand{\bvec}{\mathbf b}\) \(\newcommand{\cvec}{\mathbf c}\) \(\newcommand{\dvec}{\mathbf d}\) \(\newcommand{\dtil}{\widetilde{\mathbf d}}\) \(\newcommand{\evec}{\mathbf e}\) \(\newcommand{\fvec}{\mathbf f}\) \(\newcommand{\nvec}{\mathbf n}\) \(\newcommand{\pvec}{\mathbf p}\) \(\newcommand{\qvec}{\mathbf q}\) \(\newcommand{\svec}{\mathbf s}\) \(\newcommand{\tvec}{\mathbf t}\) \(\newcommand{\uvec}{\mathbf u}\) \(\newcommand{\vvec}{\mathbf v}\) \(\newcommand{\wvec}{\mathbf w}\) \(\newcommand{\xvec}{\mathbf x}\) \(\newcommand{\yvec}{\mathbf y}\) \(\newcommand{\zvec}{\mathbf z}\) \(\newcommand{\rvec}{\mathbf r}\) \(\newcommand{\mvec}{\mathbf m}\) \(\newcommand{\zerovec}{\mathbf 0}\) \(\newcommand{\onevec}{\mathbf 1}\) \(\newcommand{\real}{\mathbb R}\) \(\newcommand{\twovec}[2]{\left[\begin{array}{r}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\ctwovec}[2]{\left[\begin{array}{c}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\threevec}[3]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\cthreevec}[3]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\fourvec}[4]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\cfourvec}[4]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\fivevec}[5]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\cfivevec}[5]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\mattwo}[4]{\left[\begin{array}{rr}#1 \amp #2 \\ #3 \amp #4 \\ \end{array}\right]}\) \(\newcommand{\laspan}[1]{\text{Span}\{#1\}}\) \(\newcommand{\bcal}{\cal B}\) \(\newcommand{\ccal}{\cal C}\) \(\newcommand{\scal}{\cal S}\) \(\newcommand{\wcal}{\cal W}\) \(\newcommand{\ecal}{\cal E}\) \(\newcommand{\coords}[2]{\left\{#1\right\}_{#2}}\) \(\newcommand{\gray}[1]{\color{gray}{#1}}\) \(\newcommand{\lgray}[1]{\color{lightgray}{#1}}\) \(\newcommand{\rank}{\operatorname{rank}}\) \(\newcommand{\row}{\text{Row}}\) \(\newcommand{\col}{\text{Col}}\) \(\renewcommand{\row}{\text{Row}}\) \(\newcommand{\nul}{\text{Nul}}\) \(\newcommand{\var}{\text{Var}}\) \(\newcommand{\corr}{\text{corr}}\) \(\newcommand{\len}[1]{\left|#1\right|}\) \(\newcommand{\bbar}{\overline{\bvec}}\) \(\newcommand{\bhat}{\widehat{\bvec}}\) \(\newcommand{\bperp}{\bvec^\perp}\) \(\newcommand{\xhat}{\widehat{\xvec}}\) \(\newcommand{\vhat}{\widehat{\vvec}}\) \(\newcommand{\uhat}{\widehat{\uvec}}\) \(\newcommand{\what}{\widehat{\wvec}}\) \(\newcommand{\Sighat}{\widehat{\Sigma}}\) \(\newcommand{\lt}{<}\) \(\newcommand{\gt}{>}\) \(\newcommand{\amp}{&}\) \(\definecolor{fillinmathshade}{gray}{0.9}\)Supongamos que mi amigo está armando un nuevo cuestionario destinado a medir “malhumorado”. La encuesta tiene 50 preguntas, que puedes responder de manera gruñona o no. A través de una gran muestra (hipotéticamente, ¡imaginemos un millón de personas más o menos!) los datos están distribuidos de manera bastante normal, siendo la puntuación media de maldad 17 de 50 preguntas respondidas de manera gruñona, y la desviación estándar es 5. En contraste, cuando tomo el cuestionario, contesto 35 de 50 preguntas de manera gruñona. Entonces, ¿qué tan gruñón estoy? Una forma de pensar sería decir que tengo malhumorado de 35/50, así que podrías decir que estoy 70% gruñón. Pero eso es un poco raro, cuando lo piensas. Si mi amiga hubiera formulado sus preguntas de manera un poco diferente, la gente podría haberlas respondido de una manera diferente, por lo que la distribución general de las respuestas podría moverse fácilmente hacia arriba o hacia abajo dependiendo de la forma precisa en que se formularan las preguntas. Entonces, solo estoy 70% gruñón con respecto a este conjunto de preguntas de la encuesta. Aunque sea un cuestionario muy bueno, esta no es una declaración muy informativa.
Una forma más sencilla de evitar esto es describir mi maldad comparándome con otras personas. Sorprendentemente, de la muestra de mi amigo de 1,000,000 de personas, solo 159 personas estaban tan gruñonas como yo (eso no es nada poco realista, francamente), lo que sugiere que estoy en el 0.016% superior de las personas por malhumorado. Esto tiene mucho más sentido que tratar de interpretar los datos brutos. Esta idea —que debemos describir mi maldad en términos de la distribución general de la maldad de los humanos— es la idea cualitativa a la que intenta llegar la estandartización. Una forma de hacer esto es hacer exactamente lo que acabo de hacer, y describir todo en términos de percentiles. No obstante, el problema de hacer esto es que “es solitario en la cima”. Supongamos que mi amigo sólo había recogido una muestra de 1000 personas (todavía una muestra bastante grande para los fines de probar un nuevo cuestionario, me gustaría agregar), y esta vez obtuvo una media de 16 de 50 con una desviación estándar de 5, digamos. El problema es que casi seguro, ni una sola persona en esa muestra estaría tan gruñón como yo.
Sin embargo, no todo está perdido. Un enfoque diferente es convertir mi puntaje de maldad en una puntuación estándar, también conocida como puntaje z. El puntaje estándar se define como el número de desviaciones estándar por encima de la media que miente mi puntaje de maldad. Para expresarlo en “pseudo-matemáticas” la puntuación estándar se calcula así:
puntaje estándar\(=\dfrac{\text { raw score }-\text { mean }}{\text { standard deviation }}\)
En matemáticas reales, la ecuación para la puntuación z es
\(z_{i}=\dfrac{X_{i}-\bar{X}}{\hat{\sigma}}\)
Entonces, volviendo a los datos de maldad, ahora podemos transformar la maldad cruda de Dan en un puntaje estandarizado de gruñidos. 76 Si la media es 17 y la desviación estándar es 5 entonces mi puntaje de maldad estandarizado sería 77
$$
z=\ dfrac {35-17} {5} =3.6
\ no número$$
Para interpretar este valor, recordemos la heurística aproximada que proporcioné en la Sección 5.2.5, en la que señalé que se espera que 99.7% de los valores se encuentren dentro de 3 desviaciones estándar de la media. Entonces el hecho de que mi maldad corresponda a una puntuación z de 3.6 indica que estoy muy gruñón de hecho. Más adelante, en la Sección 9.5, voy a introducir una función llamada pnorm ()
que nos permite ser un poco más precisos que esto. Específicamente, nos permite calcular un rango percentil teórico para mi maldad, de la siguiente manera:
pnorm( 3.6 )
## [1] 0.9998409
En esta etapa, este comando no tiene mucho sentido, pero no se preocupe demasiado por ello. No es importante por ahora. Pero el resultado es bastante sencillo: sugiere que estoy más gruñón que el 99.98% de las personas. Suena bien.
Además de permitirle interpretar una puntuación cruda en relación con una población más grande (y con ello permitirle dar sentido a las variables que se encuentran en escalas arbitrarias), las puntuaciones estándar sirven para una segunda función útil. Los puntajes estándar se pueden comparar entre sí en situaciones donde los puntajes brutos no pueden. Supongamos, por ejemplo, que mi amigo también tenía otro cuestionario que midió la extraversión usando un cuestionario de 24 ítems. La media general para esta medida resulta ser 13 con desviación estándar 4; y obtuve un 2. Como puedes imaginar, no tiene mucho sentido tratar de comparar mi puntaje crudo de 2 en el cuestionario de extraversión con mi puntaje crudo de 35 en el cuestionario de malhumordad. Las puntuaciones crudas para las dos variables son “sobre” cosas fundamentalmente diferentes, así que esto sería como comparar manzanas con naranjas.
¿Qué pasa con los puntajes estándar? Bueno, esto es un poco diferente. Si calculamos las puntuaciones estándar, obtenemos z= (35−17) /5=3.6 para gruñidos y z= (2−13) /4=−2.75 para la extraversión. Estos dos números se pueden comparar entre sí. 78 Estoy mucho menos extravertida que la mayoría de la gente (z=−2.75) y mucho más gruñona que la mayoría de la gente (z=3.6): pero el alcance de mi inusualidad es mucho más extremo para el mal humor (ya que 3.6 es un número mayor que 2.75). Debido a que cada puntaje estandarizado es una declaración sobre dónde cae una observación en relación con su propia población, es posible comparar puntuaciones estandarizadas en variables completamente diferentes.