2.7: Rodando tus propias estadísticas descriptivas

Última actualización
Guardar como PDF

Page ID: 150330

\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

\( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)

( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)

\( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

\( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)

\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

\( \newcommand{\Span}{\mathrm{span}}\)

\( \newcommand{\id}{\mathrm{id}}\)

\( \newcommand{\Span}{\mathrm{span}}\)

\( \newcommand{\kernel}{\mathrm{null}\,}\)

\( \newcommand{\range}{\mathrm{range}\,}\)

\( \newcommand{\RealPart}{\mathrm{Re}}\)

\( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

\( \newcommand{\Argument}{\mathrm{Arg}}\)

\( \newcommand{\norm}[1]{\| #1 \|}\)

\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

\( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)

\( \newcommand{\vectorA}[1]{\vec{#1}} % arrow\)

\( \newcommand{\vectorAt}[1]{\vec{\text{#1}}} % arrow\)

\( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

\( \newcommand{\vectorC}[1]{\textbf{#1}} \)

\( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)

\( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)

\( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)

\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

Pasamos muchos párrafos hablando de variación en números, y cómo usar calcular la varianza y desviación estándar para resumir las diferencias promedio entre números en un conjunto de datos. El proceso básico fue 1) calcular alguna medida de las diferencias, luego 2) promediar las diferencias para crear un resumen. Encontramos que no podíamos promediar los puntajes brutos de diferencia, porque siempre obtendríamos un cero. Entonces, cuadramos las diferencias con respecto a la media, luego promediamos las diferencias al cuadrado. Finalmente, enraizamos nuestra medida para volver a bajar el resumen a la escala de los números originales.

Quizás no hayas escuchado, pero hay más de una forma de despellejar a un gato, pero preferimos pensar en esto en términos de acariciar gatos, porque a algunos de nosotros nos encantan los gatos. Chistes a un lado, quizás también estabas pensando que el problema de sumar puntuaciones de diferencias (para que no sean iguales a cero), se puede resolver de más de una manera. ¿Se te ocurre una manera diferente, además de cuadrar?

Desviaciones absolutas

¿Qué tal simplemente tomar el valor absoluto de las puntuaciones de diferencia? Recuerde, el valor absoluto convierte cualquier número en un valor positivo. Consulta la siguiente tabla:

puntajes	valores	media	Diferencia_desde_media	Absolute_Desviaciones
1	1	4.5	-3.5	3.5
2	6	4.5	1.5	1.5
3	4	4.5	-0.5	0.5
4	2	4.5	-2.5	2.5
5	6	4.5	1.5	1.5
6	8	4.5	3.5	3.5
Sumas	27	27	0	13
Medios	4.5	4.5	0	2.166666666667

Esto también funciona bastante bien. Al convertir las puntuaciones de diferencia de la media a valores positivos, ahora podemos sumarlas y obtener un valor distinto de cero (si hay diferencias). Entonces, podemos encontrar la media de la suma de las desviaciones absolutas. Si tuviéramos que mapear los términos suma de cuadrados (SS), varianza y desviación estándar sobre estas nuevas medidas basadas en la desviación absoluta, ¿cómo iría el mapeo? Por ejemplo, ¿qué valor en la tabla corresponde al SS? Esa sería la suma de las desviaciones absolutas en la última columna. ¿Qué tal la varianza y desviación estándar, a qué corresponden esas? Recuerde que la varianza es media (\(SS/N\)), y la desviación estándar es una media de raíz cuadrada (\(\sqrt{SS/N}\)). En la tabla anterior solo tenemos una media correspondiente, la media de la suma de las desviaciones absolutas. Entonces, tenemos una medida de varianza que no necesita ser de raíz cuadrada. Podríamos decir que la desviación media absoluta, es hacer doble deber como varianza y desviación estándar. Limo.

Otras operaciones de inversión de señales

En principio, podríamos crear muchas estadísticas de resumen diferentes para la varianza que resuelven el problema de suma a cero. Por ejemplo, podríamos elevar cada puntuación de diferencia a cualquier potencia par más allá de 2 (que es el cuadrado). Podríamos usar, 4, 6, 8, 10, etc. Hay una infinidad de números pares, por lo que hay una infinidad de posibles estadísticas de varianza. También podríamos usar números impares como potencias, y luego tomar su valor absoluto. Muchas cosas son posibles. El aspecto importante de cualquiera de esto es tener una razón para lo que estás haciendo, y elegir un método que funcione para el problema de análisis de datos que estás tratando de resolver. Nota también, traemos a colación este tema general porque queremos que entiendas que la estadística es un ejercicio creativo. Inventamos cosas cuando las necesitamos, y usamos cosas que ya se inventaron cuando trabajan para el problema que nos ocupa.