Saltar al contenido principal
LibreTexts Español

11.6: Medidas de Variación

  • Page ID
    110429
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Considera estos tres conjuntos de puntajes del cuestionario:

    • Sección A: 5 5 5 5 5 5 5 5 5 5
    • Sección B: 0 0 0 0 0 10 10 10 10 10
    • Sección C: 4 4 5 5 5 5 6 6 6

    Los tres conjuntos de datos tienen una media de 5 y una mediana de 5, sin embargo, los conjuntos de puntuaciones son claramente bastante diferentes. En la sección A, todos tenían la misma puntuación; en la sección B la mitad de la clase no obtuvo puntos y la otra mitad obtuvo una puntuación perfecta, asumiendo que se trataba de una prueba de 10 puntos. La sección C no fue tan consistente como la sección A, pero no tan variada como la sección B.

    Además de la media y mediana, que son medidas del valor “típico” o “medio”, también necesitamos una medida de cuán “extendido” o variado está cada conjunto de datos.

    Existen varias formas de medir esta “propagación” de los datos. El primero es el más simple y se llama el rango.

    Rango

    El rango es la diferencia entre el valor máximo y el valor mínimo del conjunto de datos.

    Ejemplo 23

    Usando las puntuaciones del cuestionario de arriba,

    Para la sección A, el rango es 0 ya que tanto el máximo como el mínimo son 5 y\(5 – 5 = 0\)

    Para la sección B, el rango es 10 ya que\(10 – 0 = 10\)

    Para la sección C, el rango es 2 ya que\(6 – 4 = 2\)

    En el último ejemplo, el rango parece estar revelando cuán dispersos están los datos. No obstante, supongamos que sumamos una cuarta sección, Sección D, con puntuaciones 0 5 5 5 5 5 5 5 5 5 5 10.

    Esta sección también tiene una media y mediana de 5. El rango es 10, sin embargo, este conjunto de datos es bastante diferente a la Sección B. Para iluminar mejor las diferencias, tendremos que recurrir a medidas de variación más sofisticadas.

    Desviación estándar

    La desviación estándar es una medida de variación basada en medir hasta qué punto cada valor de datos se desvía, o es diferente, de la media. Algunas características importantes:

    • La desviación estándar siempre es positiva. La desviación estándar será cero si todos los valores de los datos son iguales, y se hará más grande a medida que los datos se desplieguen.
    • La desviación estándar tiene las mismas unidades que los datos originales.
    • La desviación estándar, al igual que la media, puede estar muy influenciada por valores atípicos.

    Usando los datos de la sección D, podríamos calcular para cada valor de datos la diferencia entre el valor de datos y la media:

    \ (\ begin {array} {|l|l|}
    \ hline\ text {valor de datos} &\ text {desviación: valor de datos - media}
    \\\ hline 0 & 0-5=-5
    \\ hline 5 & 5-5=0
    \\ hline 5 & 5-5=0
    \\ hline 5 & 5-5=0
    \\ hline 5 & 5-5=0\
    \ hline 5 & 5-5=0\
    \ hline 5 & 5-5=0\
    \ hline 5 & 5-5=0\
    \ hline 5 & 5-5=0\
    \ hline 10 & 10-5=5\\ hline\
    \ hline
    \ end {array}\)

    Nos gustaría tener una idea de la desviación “promedio” de la media, pero si encontramos el promedio de los valores en la segunda columna los valores negativos y positivos se cancelan entre sí (esto siempre sucederá), así que para evitar esto cuadramos cada valor en la segunda columna:

    Luego agregamos las desviaciones cuadradas hasta obtener\(25 + 0 + 0 + 0 + 0 + 0 + 0 + 0 + 0 + 25 = 50\). Ordinariamente entonces dividiríamos por el número de puntajes\(n\),, (en este caso, 10) para encontrar la media de las desviaciones. Pero solo hacemos esto si el conjunto de datos representa una población; si el conjunto de datos representa una muestra (como casi siempre lo hace), dividimos por\(n - 1\) (en este caso,\(10 - 1 = 9\)). [1]

    Entonces en nuestro ejemplo, tendríamos\(\frac{50}{10} = 5\) si la sección D representa una población y\(\frac{50}{9} =\) alrededor de 5.56 si la sección D representa una muestra. Estos valores (5 y 5.56) se denominan, respectivamente, la varianza poblacional y la varianza muestral para la sección D.

    La varianza puede ser un concepto estadístico útil, pero tenga en cuenta que las unidades de varianza en esta instancia serían puntos al cuadrado ya que cuadramos todas las desviaciones. ¿Qué son los puntos-cuadrados? Buena pregunta. Preferiríamos tratar con las unidades con las que empezamos (puntos en este caso), así que para volver a convertir tomamos la raíz cuadrada y obtenemos:

    \[\text{population standard deviation} =\sqrt{\frac{50}{10}}=\sqrt{5} \approx 2.2 \nonumber \]

    o

    \[\text{sample standard deviation} =\sqrt{\frac{50}{9}} \approx 2.4 \nonumber \]

    Si no estamos seguros de si el conjunto de datos es una muestra o una población, generalmente asumiremos que es una muestra, y redondearemos las respuestas a un decimal más que los datos originales, como hemos hecho anteriormente.

    Para calcular la desviación estándar:

    1. Encuentra la desviación de cada dato de la media. Es decir, restar la media del valor de los datos.
    2. Cuadrando cada desviación.
    3. Añadir las desviaciones al cuadrado.
    4. Dividir por\(n\), el número de valores de datos, si los datos representan una población completa; dividir por\(n – 1\) si los datos son de una muestra.
    5. Calcular la raíz cuadrada del resultado.

    Ejemplo 24

    Calculando la desviación estándar para la Sección B anterior, primero calculamos que la media es 5. El uso de una tabla puede ayudar a realizar un seguimiento de sus cálculos para la desviación estándar:

    \ (\ begin {array} {|l|l|l|}
    \ hline\ text {valor de datos} &\ text {desviación: valor de datos - media} &\ text {desviación cuadrada}\\ hline 0 & 0-5=-5 & (-5) ^ {2} =25
    \\ hline 0 & 0-5=-5 & (-5) ^ {2} =25\
    \ hline 0 & 0-5=-5 & (-5) ^ {2} =25\
    \ hline 0 & 0-5=-5 & (-5) ^ {2} =25 5=-5 y (-5) ^ {2} =25\
    \ hline 0 & 0-5=-5 & (-5) ^ {2} =25\
    \ hline 0 & 0-5=-5 & (-5) ^ {2} =25\
    \ hline 10 & 10-5=5 & (5) ^ {2} =25\
    \ hline 10 & 10-5=5 & (5) ^ {2} =25\
    \ hline 10 & 10-5=5 & (5) ^ {2} =25\\
    \ hline 10 & 10-5=5 & (5) ^ {2} =25\\
    \ hline 10 & 10-5=5 & (5) ^ {2} =25\
    \ hline
    \ end {array}\)

    Suponiendo que estos datos representan una población, agregaremos las desviaciones cuadradas, dividiremos por 10, el número de valores de datos y calcularemos la raíz cuadrada:

    \[\sqrt{\frac{25+25+25+25+25+25+25+25+25+25}{10}}=\sqrt{\frac{250}{10}}=5 \nonumber \]

    Observe que la desviación estándar de este conjunto de datos es mucho mayor que la de la sección D ya que los datos de este conjunto están más dispersos.

    A modo de comparación, las desviaciones estándar de las cuatro secciones son:

    \ (\ begin {array} {|l|l|}
    \ hline\ text {Sección A: 5 5 5 5 5 5 5 5 5 5 5} &\ text {Desviación estándar: 0}
    \\\ hline\ text {Sección B: 0 0 0 0 10 10 10 10 10 10} &\ text {Desviación estándar: 5}
    \\\ hline\ text {Sección C: 4 4 5 5 5 6 6} &\ texto { Desviación estándar: 0.8}\
    \\ hline\ text {Sección D: 0 5 5 5 5 5 5 5 5 5 10} &\ text {Desviación estándar: 2.2}\
    \\ hline
    \ end {array}\)

    Pruébalo ahora 7

    El precio de un frasco de mantequilla de maní en 5 tiendas fue: $3.29, $3.59, $3.79, $3.75, y $3.99. Encuentra la desviación estándar de los precios.

    Contestar

    Anteriormente encontramos que la media de los datos fue de $3.682.

    \ (\ begin {array} {|l|l|l|}
    \ hline\ text {valor de datos} &\ text {desviación: valor de datos - media} &\ text {desviación cuadrada}
    \\ hline 3.29 & 3.29-3.682 = -0.391 & 0.153664\
    \ hline 3.59 & 3.59-3.682=-0.092 & 0.008464\\
    \ hline 3.79 & 3.79-3.682=0.108 & 0.011664\
    \ hline 3.75 & 3.75-3.682=0.068 & 0.004624\\
    \ hline 3.99 & 3.99-3.682=0.308 & 0.094864\
    \ hline
    \ end {array}\)

    Estos datos son de una muestra, por lo que agregaremos las desviaciones cuadradas, dividiremos por 4, el número de valores de datos menos 1, y calcularemos la raíz cuadrada:

    \(\sqrt{\frac{0.153664+0.008464+0.011664+0.004624+0.094864}{4}} \approx \$ 0.261\)

    Cuando la desviación estándar es una medida de variación basada en la media, los cuartiles se basan en la mediana.

    Cuartiles

    Los cuartiles son valores que dividen los datos en trimestres.

    El primer cuartil (\(Q_1\)) es el valor de manera que 25% de los valores de datos están por debajo de él; el tercer cuartil (\(Q_3\)) es el valor de manera que 75% de los valores de datos están por debajo de él. Es posible que hayas adivinado que el segundo cuartil es lo mismo que la mediana, ya que la mediana es el valor por lo que el 50% de los valores de los datos están por debajo de él.

    Esto divide los datos en trimestres; 25% de los datos se encuentra entre el mínimo y\(Q_1\), 25% está entre\(Q_1\) y la mediana, 25% está entre la mediana y\(Q_3\), y 25% está entre\(Q_3\) y el valor máximo

    Si bien los cuartiles no son un resumen de variación de 1 número como la desviación estándar, los cuartiles se utilizan con los valores de mediana, mínimo y máximo para formar un resumen de 5 números de los datos.

    Resumen de cinco números

    El resumen de cinco números toma esta forma:

    Mínimo\(Q_1\), Mediana,\(Q_3\), Máximo

    Para encontrar el primer cuartil, necesitamos encontrar el valor de los datos para que el 25% de los datos estén por debajo de él. Si\(n\) es el número de valores de datos, calculamos un localizador encontrando 25% de\(n\). Si este localizador es un valor decimal, redondeamos y encontramos el valor de los datos en esa posición. Si el localizador es un número entero, encontramos la media del valor de datos en esa posición y el siguiente valor de datos. Esto es idéntico al proceso que usamos para encontrar la mediana, excepto que usamos 25% de los valores de datos en lugar de la mitad de los valores de datos como localizador.

    Para encontrar el primer cuartil,\(Q_1\)

    Comience ordenando los datos de menor a mayor

    Calcular el localizador:\(L = 0.25n\)

    Si\(L\) es un valor decimal:

    Redondear hasta\(L+\)

    Usar el valor de los datos en la\(L+^{\text{th}}\) posición

    Si\(L\) es un número entero:

    Encuentra la media de los valores de datos en las\(L+1^{\text{th}}\) posiciones\(L^{\text{th}}\) y.

    Para encontrar el tercer cuartil,\(Q_3\)

    Utilice el mismo procedimiento que para\(Q_1\), pero con localizador:\(L = 0.75n\)

    Los ejemplos deberían ayudar a que esto sea más claro.

    Ejemplo 25

    Supongamos que hemos medido 9 hembras y sus alturas (en pulgadas), ordenadas de menor a mayor son:

    59 60 62 64 66 67 69 70 72

    Para encontrar el primer cuartil primero calculamos el localizador: 25% de 9 es\(L = 0.25(9) = 2.25\). Dado que este valor no es un número entero, redondeamos hasta 3. El primer cuartil será el tercer valor de datos: 62 pulgadas.

    Para encontrar el tercer cuartil, nuevamente calculamos el localizador: 75% de 9 es\(0.75(9) = 6.75\). Dado que este valor no es un número entero, redondeamos hasta 7. El tercer cuartil será el séptimo valor de datos: 69 pulgadas.

    Ejemplo 26

    Supongamos que habíamos medido 8 hembras y sus alturas (en pulgadas), ordenadas de menor a mayor son:

    59 60 62 64 66 67 69 70

    Para encontrar el primer cuartil primero calculamos el localizador: 25% de 8 es\(L = 0.25(8) = 2\). Dado que este valor es un número entero, encontraremos la media de los valores de datos 2 y 3 rd: (60+62) /2 = 61, por lo que el primer cuartil es de 61 pulgadas.

    El tercer cuartil se calcula de manera similar, utilizando 75% en lugar de 25%. \(L = 0.75(8) = 6\). Se trata de un número entero, por lo que encontraremos la media de los valores de datos y 7º:\(\frac{67+69}{2} = 68\), así\(Q_3\) es 68.

    Tenga en cuenta que la mediana podría calcularse de la misma manera, usando 50%.

    El resumen de 5 números combina el primer y tercer cuartil con los valores mínimo, mediano y máximo.

    Ejemplo 27

    Para la muestra de 9 mujeres, la mediana es 66, la mínima es 59 y la máxima es 72. El resumen del número 5 es: 59, 62, 66, 69, 72.

    Para la muestra de 8 mujeres, la mediana es 65, la mínima es 59, y la máxima es 70, por lo que el resumen de 5 números sería: 59, 61, 65, 68, 70.

    Ejemplo 28

    Volviendo a nuestros datos de puntuación del cuestionario. En cada caso, el primer localizador de cuartil es\(0.25(10) = 2.5\), por lo que el primer cuartil será el tercer valor de datos, y el tercer cuartil será el octavo valor de datos. Creando los resúmenes de cinco números:

    \ (\ begin {array} {|l|l|}
    \ hline\ text {Sección y datos} &\ texto {resumen de 5 números}\
    \\ hline\ texto {Sección A: 5 5 5 5 5 5 5 5 5 5 5} & 5,5,5,5,5
    \\ hline\ texto {Sección B: 0 0 0 0 0 10 10 10 10 10} & 0,0,5,10,10\
    \ hline\ texto { Sección C: 4 4 4 5 5 5 5 5 6 6 6} & 4,4,5,6,6\
    \ hline\ text {Sección D: 0 5 5 5 5 5 5 5 5 5 5 10} & 0,5,5,5,10\
    \ hline
    \ end {array}\)

    Por supuesto, con un conjunto de datos relativamente pequeño, encontrar un resumen de cinco números es un poco tonto, ya que el resumen contiene casi tantos valores como los datos originales.

    Pruébalo ahora 8

    El costo total de los libros de texto para el término se recolectó de 36 estudiantes. Encuentra el resumen de 5 números de estos datos.

    $140 $160 $160 $165 $180 $220 $235 $240 $250 $260 $280 $285

    $285 $290 $300 $300 $305 $310 $310 $315 $315 $320 $320

    $330 $340 $345 $350 $355 $360 $360 $380 $395 $420 $460 $460

    Contestar

    Los datos ya están en orden, así que no necesitamos ordenarlos primero.

    El valor mínimo es de $140 y el máximo es de $460.

    Hay 36 valores de datos por lo\(n=36 . n / 2=18,\) que es un número entero, por lo que la mediana es la media de los\(18^{\text {th }}\) y los valores de\(19^{\text {th }}\) datos,\(\$ 305\) y\(\$ 310\). La mediana es\(\$ 307.50\)

    Para encontrar el primer cuartil, calculamos el localizador,\(L=0.25(36)=9 .\) ya que este es un número entero, sabemos que\(\mathrm{Q}_{1}\) es la media de los valores\(9^{\text {th }}\) y\(10^{\text {th }}\) datos,\(\$ 250\) y\(\$ 260 . \mathrm{Q}_{1}=\)\(\$ 255\)

    Para encontrar el tercer cuartil, calculamos el localizador,\(L=0.75(36)=27 .\) ya que este es un número entero, sabemos que\(Q_{3}\) es la media de los valores\(27^{\text {th }}\) y\(28^{\text {th }}\) datos,\(\$ 345\) y\(\$ 350\).
    \(\mathrm{Q}_{3}=\$ 347.50\)

    El resumen del número 5 de estos datos es: $140, $255, $307.50, $347.50, $460

    Ejemplo 29

    Volviendo a los datos de ingresos de los hogares de antes, crear el resumen de cinco números.

    \ (\ begin {array} {|l|l|}
    \ hline\ textbf {Ingresos (miles de dólares)} &\ textbf {Frecuencia}\\
    \ hline 15 & 6\\
    \ hline 20 & 8\\
    \ hline 25 & 11\\
    \ hline 30 & 17\\
    \ hline 35 & 19\\
    \ hline 40 & 20\\
    \ hline 45 & 12\\
    \ hline 50 & 7\\
    \ hline
    \ end {array}\)

    Solución

    Al sumar las frecuencias, podemos ver que hay 100 valores de datos representados en la tabla. En el Ejemplo 20, encontramos que la mediana fue de $35 mil. Podemos ver en la tabla que el ingreso mínimo es de $15 mil, y el máximo es de $50 mil.

    Para encontrar\(Q_1\), calculamos el localizador: L = 0.25 (100) = 25. Se trata de un número entero, así\(Q_1\) será la media de los valores de datos 25 y 26 º.

    Contando en los datos como lo hacíamos antes,

    \(\begin{array}{ll} \text{There are 6 data values of \$15, so} & \text{Values 1 to 6 are \$15 thousand} \\ \text{The next 8 data values are \$20, so} & \text{Values 7 to (6+8)=14 are \$20 thousand} \\ \text{The next 11 data values are \$25, so} & \text{Values 15 to (14+11)=25 are \$25 thousand} \\ \text{The next 17 data values are \$30, so} & \text{Values 26 to (25+17)=42 are \$30 thousand} \end{array}\)

    El 25 º valor de datos es de 25 mil dólares, y el 26 º valor de datos es de $30 mil, así\(Q_1\) será la media de estos:\((25 + 30)/2 = \$27.5\) mil.

    Para encontrar\(Q_3\), calculamos el localizador:\(L = 0.75(100) = 75\). Se trata de un número entero, así\(Q_3\) será la media de los valores de los datos 75 y 76 º. Continuando nuestro conteo desde antes,

    \(\begin{array}{ll} \text{The next 19 data values are $35, so} & \text{Values 43 to (42+19)=61 are \$35 thousand} \\ \text{The next 20 data values are \$40, so} & \text{Values 61 to (61+20)=81 are \$40 thousand} \end{array}\)

    Tanto los valores de los datos 75 y 76 º se encuentran en este grupo, por lo que\(Q_3\) serán 40 mil dólares.

    Al juntar estos valores en un resumen de cinco números, obtenemos: 15, 27.5, 35, 40, 50

    Tenga en cuenta que el resumen de 5 números divide los datos en cuatro intervalos, cada uno de los cuales contendrá alrededor del 25% de los datos. En el ejemplo anterior, eso significa que alrededor del 25% de los hogares tienen ingresos entre $40 mil y $50 mil.

    Para visualizar datos, hay una representación gráfica de un resumen de 5 números llamado diagrama de caja, o gráfico de caja y bigotes.

    Parcela de caja

    Un diagrama de caja es una representación gráfica de un resumen de cinco números.

    Para crear una gráfica de caja, primero se dibuja una recta numérica. Se dibuja una caja desde el primer cuartil hasta el tercer cuartil, y se dibuja una línea a través de la caja en la mediana. Los “bigotes” se extienden a los valores mínimo y máximo.

    Ejemplo 30

    La gráfica de caja a continuación se basa en los datos de altura de 9 hembras con resumen de 5 números:

    59, 62, 66, 69, 72.

    Un diagrama de caja. El eje horizontal está etiquetado como Alturas (pulgadas) y va de 55 a 75. Hay una caja dibujada del 62 al 69, con una línea vertical que la divide en 66. Desde la caja, una línea se extiende hacia la izquierda hasta 59 donde hay una línea vertical, y desde la caja una línea se extiende hacia la derecha hasta 72 donde hay una línea vertical.

    Ejemplo 31

    La gráfica de cuadro a continuación se basa en los datos de ingresos familiares con resumen de 5 números:

    15, 27.5, 35, 40, 50

    Una parcela de caja titulada Ingresos del hogar. El eje horizontal está etiquetado Miles de dólares y va de 0 a 55 con escala de 5. Hay una caja dibujada de 27.5 a 40, con una línea vertical dividiéndola en 35. Desde la caja, una línea se extiende hacia la izquierda hasta 15 donde hay una línea vertical, y desde la caja una línea se extiende hacia la derecha hasta 50 donde hay una línea vertical.

    Pruébalo ahora 9

    Crea una gráfica de caja basada en los datos de precios del libro de texto del último Pruébalo ahora.

    Contestar

    Un diagrama de caja titulado Costos del libro de texto. El eje horizontal está etiquetado como Costo (dólares) y va de 100 a 500 con escala de 50. Hay una caja dibujada de 255 a 347.50, con una línea vertical dividiéndola en 307.50. Desde la caja, una línea se extiende hacia la izquierda hasta 140 donde hay una línea vertical, y desde la caja una línea se extiende hacia la derecha hasta 460 donde hay una línea vertical.

    Las parcelas de caja son particularmente útiles para comparar datos de dos poblaciones.

    Ejemplo 32

    A continuación se muestra la trama de caja de tiempos de servicio para dos restaurantes de comida rápida.

    Un diagrama de caja comparativo. El eje horizontal está etiquetado como tiempos de servicio (minutos) y va de 0 a 10. La primera caja etiquetada Tienda 1 tiene una caja de 1.8 a 2.9 con una división media en 2.3, y bigotes hacia fuera a 0.7 y 6.3. La segunda caja etiquetada como Tienda 2 tiene una caja de 1.1 a 5.7 con una división media en 2.1, y bigotes a 0.5 y 9.6.

    Mientras que la tienda 2 tuvo una mediana de tiempo de servicio ligeramente más corta (2.1 minutos vs. 2.3 minutos), la tienda 2 es menos consistente, con una distribución más amplia de los datos.

    En la tienda 1, 75% de los clientes fueron atendidos dentro de 2.9 minutos, mientras que en la tienda 2, 75% de los clientes fueron atendidos dentro de 5.7 minutos.

    ¿A qué tienda deberías ir a toda prisa? Eso depende de tus opiniones sobre la suerte — 25% de los clientes de la tienda 2 tuvieron que esperar entre 5.7 y 9.6 minutos.

    Ejemplo 33

    La gráfica de caja a continuación se basa en el peso al nacer de los recién nacidos con síndrome de dificultad respiratoria idiopática grave (SIRDS) [2]. La parcela de caja se separa para mostrar los pesos al nacer de los recién nacidos que sobrevivieron y los que no.

    Al comparar los dos grupos, la gráfica de caja revela que los pesos al nacer de los recién nacidos que murieron parecen ser, en general, menores que los pesos de los recién nacidos que sobrevivieron. De hecho, podemos ver que la mediana de peso al nacer de los infantes que sobrevivieron es el mismo que el tercer cuartil de los infantes que murieron.

    De igual manera, podemos ver que el primer cuartil de los sobrevivientes es mayor que el peso medio de los que murieron, lo que significa que más del 75% de los sobrevivientes tuvieron un peso al nacer mayor que el peso medio al nacer de los que murieron.

    Al observar el valor máximo para los que murieron y el tercer cuartil de los sobrevivientes, podemos ver que más del 25% de los sobrevivientes tuvieron pesos al nacer más altos que el infante más pesado que murió.

    La trama de caja nos da una manera rápida, aunque informal, de determinar que el peso al nacer está muy probablemente vinculado a la supervivencia de los infantes con SIRDS.

    Un diagrama de caja comparativo. El eje horizontal está etiquetado Peso al nacer (kg) y va de 0 a 4. Los valores de caja no están etiquetados, por lo que aquí se dan aproximaciones. La primera caja etiquetada Survist tiene una caja de 1.6 a 2.7 con una división media en 2.2, y bigotes hacia fuera a 1.2 y 3.7. La segunda caja etiquetada Murió tiene una caja de 1.3 a 2.2 con una división media en 1.5, y bigotes hacia fuera a 1.1 y 2.6.


    [1] La razón por la que hacemos esto es altamente técnica, pero podemos ver cómo podría ser útil considerando el caso de una muestra pequeña de una población que contiene un valor atípico, lo que aumentaría la desviación promedio: el valor atípico muy probablemente no se incluirá en la muestra, por lo que la desviación media de la muestra sería subestimamos la desviación media de la población; así dividimos por un número ligeramente menor para obtener una desviación promedio ligeramente mayor.

    [2] van Vliet, P.K. y Gupta, J.M. (1973) Bicarbonato de sodio en el síndrome de dificultad respiratoria idiopática. Arco. Enfermedad en la Infancia, 48, 249—255. Según lo citado en http://openlearn.open.ac.uk/mod/ouco... §ion=1.1.3


    This page titled 11.6: Medidas de Variación is shared under a CC BY-SA 3.0 license and was authored, remixed, and/or curated by David Lippman & Jeff Eldridge (The OpenTextBookStore) via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.