3.2: Medidas de propagación

Última actualización
Guardar como PDF

Page ID: 149651

$ \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } $ $ \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} $$\newcommand{\id}{\mathrm{id}}$ $ \newcommand{\Span}{\mathrm{span}}$ $ \newcommand{\kernel}{\mathrm{null}\,}$ $ \newcommand{\range}{\mathrm{range}\,}$ $ \newcommand{\RealPart}{\mathrm{Re}}$ $ \newcommand{\ImaginaryPart}{\mathrm{Im}}$ $ \newcommand{\Argument}{\mathrm{Arg}}$ $ \newcommand{\norm}[1]{\| #1 \|}$ $ \newcommand{\inner}[2]{\langle #1, #2 \rangle}$ $ \newcommand{\Span}{\mathrm{span}}$ $\newcommand{\id}{\mathrm{id}}$ $ \newcommand{\Span}{\mathrm{span}}$ $ \newcommand{\kernel}{\mathrm{null}\,}$ $ \newcommand{\range}{\mathrm{range}\,}$ $ \newcommand{\RealPart}{\mathrm{Re}}$ $ \newcommand{\ImaginaryPart}{\mathrm{Im}}$ $ \newcommand{\Argument}{\mathrm{Arg}}$ $ \newcommand{\norm}[1]{\| #1 \|}$ $ \newcommand{\inner}[2]{\langle #1, #2 \rangle}$ $ \newcommand{\Span}{\mathrm{span}}$$\newcommand{\AA}{\unicode[.8,0]{x212B}}$

La variabilidad es una idea importante en la estadística. Si tuvieras que medir la altura de todos en tu salón de clases, cada observación te da un valor diferente. Eso significa que no todos los estudiantes tienen la misma altura. Así, existe variabilidad en las alturas de las personas. Si tuvieras que tomar una muestra del nivel de ingresos de las personas en un pueblo, cada muestra te da información diferente. También hay variabilidad entre muestras. La variabilidad describe cómo se distribuyen los datos. Si los datos están muy cerca unos de otros, entonces hay poca variabilidad. Si los datos están muy dispersos, entonces hay una alta variabilidad. ¿Cómo se mide la variabilidad? Sería bueno tener un número que lo mida. En esta sección se describirán algunas de las diferentes medidas de variabilidad, también conocidas como variación.

En Ejemplo$\PageIndex{1}$, se calculó que el peso promedio de un gato era de 8.02 libras. ¿Cuánto te dice esto del peso de todos los gatos? ¿Se puede decir si la mayoría de los pesos estaban cerca de 8.02 o los pesos estaban realmente distribuidos? ¿Cuáles son el peso más alto y el peso más bajo? Todo lo que sabes es que el centro de los pesos es de 8.02 libras. Necesitas más información.

Definición$\PageIndex{1}$

El rango de un conjunto de datos es la diferencia entre los valores de datos más altos y los más bajos (o valores máximos y mínimos).

\[\begin{align*} \text{Range} &= \text{highest value} - \text{lowest value} \\[4pt] &= \text{maximum value} - \text{minimum value} \end{align*}\]

Ejemplo$\PageIndex{1}$: Finding the Range

Mira los siguientes tres conjuntos de datos. Encuentra la gama de cada uno de estos.

$10, 20, 30, 40, 50$
$10, 29, 30, 31, 50$
$28, 29, 30, 31, 32$

Solución

Captura de pantalla (47) .png — Figura$\PageIndex{1}$: Gráfica de puntos para el Ejemplo$\PageIndex{1}$ a

Captura de pantalla (48) .png — Figura$\PageIndex{2}$: Gráfica de puntos para el Ejemplo$\PageIndex{1}$ b

Captura de pantalla (49) .png — Figura$\PageIndex{3}$: Gráfica de puntos por ejemplo$\PageIndex{1}$

Con base en la media, mediana y rango en Ejemplo$\PageIndex{1}$, las dos primeras distribuciones son las mismas, pero se puede ver en las gráficas que son diferentes. En el Ejemplo$\PageIndex{1}$ a los datos se distribuyen por igual. En el Ejemplo$\PageIndex{1}$ b los datos tienen un clump en el medio y un solo valor en cada extremo. La media y la mediana son las mismas para el Ejemplo$\PageIndex{1}$ c pero el rango es muy diferente. Todos los datos se agrupan en el medio.

El rango realmente no proporciona una imagen muy precisa de la variabilidad. Se necesita una mejor manera de describir cómo se distribuyen los datos. En lugar de mirar la distancia el valor más alto es desde el más bajo ¿qué tal si se mira a la distancia cada valor es de la media? Esta distancia se llama la desviación.

Ejemplo$\PageIndex{2}$: Finding the Deviations

Supongamos que un veterinario quiere analizar los pesos de los gatos. Los pesos (en libras) de cinco gatos son 6.8, 8.2, 7.5, 9.4 y 8.2. Encuentra la desviación para cada uno de los valores de datos.

Solución

Variable:$x=$ peso de un gato

La media para este conjunto de datos es$\overline{x}=8.02$ libras.

Tabla$\PageIndex{1}$: Desviaciones de Pesos de Gatos
$x$	$x-\overline{x}$
\ (x\) ">6.8	\ (x-\ overline {x}\) ">6.8-8.02 = -1.22
\ (x\) ">8.2	\ (x-\ overline {x}\) ">8.2-8.02=0.18
\ (x\) ">7.5	\ (x-\ overline {x}\) ">7.5-8.02=-0.52
\ (x\) ">9.4	\ (x-\ overline {x}\) ">9.4-8.02=1.38
\ (x\) ">8.2	\ (x-\ overline {x}\) ">8.2-8.02=0.18

Ahora es posible que desee promediar la desviación, por lo que debe sumar las desviaciones juntas.

Tabla$\PageIndex{2}$: Suma de Desviaciones de Pesos de Gatos
$x$	$x-\overline{x}$
\ (x\) ">6.8	\ (x-\ overline {x}\) ">6.8-8.02 = -1.22
\ (x\) ">8.2	\ (x-\ overline {x}\) ">8.2-8.02=0.18
\ (x\) ">7.5	\ (x-\ overline {x}\) ">7.5-8.02=-0.52
\ (x\) ">9.4	\ (x-\ overline {x}\) ">9.4-8.02=1.38
\ (x\) ">8.2	\ (x-\ overline {x}\) ">8.2-8.02=0.18
\ (x\) ">Total	\ (x-\ overline {x}\) ">0

Esto no puede estar bien. La distancia promedio desde la media no puede ser 0. La razón por la que se suma a 0 es porque hay algunos valores positivos y negativos. Necesitas deshacerte de los signos negativos. ¿Cómo puedes hacer eso? Podrías cuadrar cada desviación.

Tabla$\PageIndex{3}$: Desviaciones Cuadradas de Pesos de Gatos
$x$	$x-\overline{x}$	$(x-\overline{x})^{2}$
\ (x\) ">6.8	\ (x-\ overline {x}\) ">6.8-8.02 = -1.22	\ ((x-\ overline {x}) ^ {2}\) ">1.4884
\ (x\) ">8.2	\ (x-\ overline {x}\) ">8.2-8.02=0.18	\ ((x-\ overline {x}) ^ {2}\) ">0.0324
\ (x\) ">7.5	\ (x-\ overline {x}\) ">7.5-8.02=-0.52	\ ((x-\ overline {x}) ^ {2}\) ">0.2704
\ (x\) ">9.4	\ (x-\ overline {x}\) ">9.4-8.02=1.38	\ ((x-\ overline {x}) ^ {2}\) ">1.9044
\ (x\) ">8.2	\ (x-\ overline {x}\) ">8.2-8.02=0.18	\ ((x-\ overline {x}) ^ {2}\) ">0.0324
\ (x\) ">Total	\ (x-\ overline {x}\) ">0	\ ((x-\ overline {x}) ^ {2}\) ">3.728

Ahora promedia el total de las desviaciones cuadradas. Lo único es que en las estadísticas hay un promedio extraño aquí. En lugar de dividir por el número de valores de datos se divide por el número de valores de datos menos 1. En este caso tendrías

$s^{2}=\dfrac{3.728}{5-1}=\dfrac{3.728}{4}=0.932 \text { pounds }^{2}$

Observe que esto se denota como$s^{2}$. Esto se llama varianza y es una medida de la distancia cuadrada promedio desde la media. Si ahora tomas la raíz cuadrada, obtendrás la distancia promedio de la media. Esto se llama la desviación estándar, y se denota con la letra$s$.

$s=\sqrt{.932} \approx 0.965$libras

La desviación estándar es la distancia promedio (media) de un punto de datos a la media. Se puede pensar en cuánto difiere un punto de datos típico de la media.

Definición$\PageIndex{2}$: Sample Variance

La fórmula de varianza muestral:

$s^{2}=\dfrac{\sum(x-\overline{x})^{2}}{n-1}$

donde$\overline{x}$ es la media de la muestra,$n$ es el tamaño de la muestra, y$\sum$ medias para encontrar la suma.

Definición$\PageIndex{3}$: Sample Standard Deviation

La fórmula de desviación estándar de la muestra:

$s=\sqrt{s^{2}}=\sqrt{\dfrac{\sum(x-\overline{x})^{2}}{n-1}}$

El$n-1$ de abajo tiene que ver con un concepto llamado grados de libertad. Básicamente, hace que la desviación estándar de la muestra sea una mejor aproximación de la desviación estándar de la población.

Definición$\PageIndex{4}$: Population Variance

La fórmula de varianza poblacional:

$\sigma^{2}=\dfrac{\sum(x-\mu)^{2}}{N}$

donde$\sigma$ es la letra griega sigma y$\sigma^{2}$ representa la varianza poblacional,$\mu$ es la media poblacional, y N es el tamaño de la población.

Definición$\PageIndex{5}$: Population Standard Deviation

La fórmula de desviación estándar poblacional:

$\sigma=\sqrt{\sigma^{2}}=\sqrt{\dfrac{\sum(x-\mu)^{2}}{N}}$

Nota

La suma de las desviaciones siempre debe ser 0. Si no lo es, entonces es porque redondeaste, usaste la mediana en lugar de la media, o cometiste un error. Trate de no redondear demasiado en los cálculos para la desviación estándar ya que cada redondeo causa un ligero error

Ejemplo$\PageIndex{3}$: Finding the Standard Deviation

Supongamos que un directivo quiere probar dos nuevos programas de capacitación. Selecciona al azar a 5 personas por cada tipo de entrenamiento y mide el tiempo que lleva completar una tarea después del entrenamiento. Los tiempos para ambos entrenamientos están en Ejemplo$\PageIndex{4}$. ¿Qué método de entrenamiento es mejor?

Tabla$\PageIndex{4}$: Tiempo para terminar la tarea en minutos
Entrenamiento 1	56	75	48	63	59
Entrenamiento 2	60	58	66	59	58

Solución

Es importante que definas qué es cada variable ya que hay dos de ellas.

Variable 1:$X_{1}=$ productividad desde el entrenamiento 1

Variable 2:$X_{2}=$ productividad del entrenamiento 2

Para responder qué método de entrenamiento mejor, primero necesitas algunas estadísticas descriptivas. Comience con la media para cada muestra.

$\overline{x}_{1}=\dfrac{56+75+48+63+59}{5}=60.2$minutos

$\overline{x}_{2}=\dfrac{60+58+66+59+58}{5}=60.2$minutos

Dado que ambos medios son los mismos valores, no se puede responder a la pregunta sobre cuál es mejor. Ahora calcule la desviación estándar para cada muestra.

Tabla$\PageIndex{5}$: Desviaciones Cuadradas para Entrenamiento 1
$x_{1}$	$x_{1}-\overline{x}_{1}$	$\left(x_{1}-\overline{x}_{1}\right)^{2}$
\ (x_ {1}\) ">56	\ (x_ {1} -\ overline {x} _ {1}\) ">-4.2	\ (\ izquierda (x_ {1} -\ overline {x} _ {1}\ derecha) ^ {2}\) ">17.64
\ (x_ {1}\) ">75	\ (x_ {1} -\ overline {x} _ {1}\) ">14.8	\ (\ izquierda (x_ {1} -\ overline {x} _ {1}\ derecha) ^ {2}\) ">219.04
\ (x_ {1}\) ">48	\ (x_ {1} -\ overline {x} _ {1}\) ">-12.2	\ (\ izquierda (x_ {1} -\ overline {x} _ {1}\ derecha) ^ {2}\) ">148.84
\ (x_ {1}\) ">63	\ (x_ {1} -\ overline {x} _ {1}\) ">2.8	\ (\ izquierda (x_ {1} -\ overline {x} _ {1}\ derecha) ^ {2}\) ">7.84
\ (x_ {1}\) ">59	\ (x_ {1} -\ overline {x} _ {1}\) ">-1.2	\ (\ izquierda (x_ {1} -\ overline {x} _ {1}\ derecha) ^ {2}\) ">1.44
\ (x_ {1}\) ">Total	\ (x_ {1} -\ overline {x} _ {1}\) ">0	\ (\ izquierda (x_ {1} -\ overline {x} _ {1}\ derecha) ^ {2}\) ">394.8

Tabla$\PageIndex{6}$: Desviaciones Cuadradas para Entrenamiento 2
$x_{2}$	$x_{2}-\overline{x}_{2}$	$\left(x_{2}-\overline{x}_{2}\right)^{2}$
\ (x_ {2}\) ">60	\ (x_ {2} -\ overline {x} _ {2}\) ">-0.2	\ (\ izquierda (x_ {2} -\ overline {x} _ {2}\ derecha) ^ {2}\) ">0.04
\ (x_ {2}\) ">58	\ (x_ {2} -\ overline {x} _ {2}\) ">-2.2	\ (\ izquierda (x_ {2} -\ overline {x} _ {2}\ derecha) ^ {2}\) ">4.84
\ (x_ {2}\) ">66	\ (x_ {2} -\ overline {x} _ {2}\) ">5.8	\ (\ izquierda (x_ {2} -\ overline {x} _ {2}\ derecha) ^ {2}\) ">33.64
\ (x_ {2}\) ">59	\ (x_ {2} -\ overline {x} _ {2}\) ">-1.2	\ (\ izquierda (x_ {2} -\ overline {x} _ {2}\ derecha) ^ {2}\) ">1.44
\ (x_ {2}\) ">58	\ (x_ {2} -\ overline {x} _ {2}\) ">-2.2	\ (\ izquierda (x_ {2} -\ overline {x} _ {2}\ derecha) ^ {2}\) ">4.84
\ (x_ {2}\) ">Total	\ (x_ {2} -\ overline {x} _ {2}\) ">0	\ (\ izquierda (x_ {2} -\ overline {x} _ {2}\ derecha) ^ {2}\) ">44.8

La varianza para cada muestra es:

$s_{1}^{2}=\dfrac{394.8}{5-1}=98.7 \text { minutes }^{2}$

$s_{2}^{2}=\dfrac{44.8}{5-1}=11.2 \text { minutes }^{2}$

Las desviaciones estándar son:

$s_{1}=\sqrt{98.7} \approx 9.93$minutos

$s_{2}=\sqrt{11.2} \approx 3.35$minutos

A partir de las desviaciones estándar, el segundo entrenamiento parecía ser el mejor entrenamiento ya que los datos están menos dispersos. Esto quiere decir que es más consistente. Sería mejor para los directivos en este caso contar con un programa de capacitación que produzca resultados más consistentes para que sepan qué esperar del tiempo que lleva completar la tarea.

Se pueden hacer los cálculos para las estadísticas descriptivas utilizando la tecnología. El procedimiento para calcular la media muestral ($\overline{x}) $y la desviación estándar de la muestra ($s_{x}$) para$X_{2}$ en el Ejemplo$\PageIndex{3}$ sobre el TI-83/84 se encuentra en las Figuras 3.2.1 a 3.2.4 (el procedimiento es el mismo para$X_{1}$). Ten en cuenta que la calculadora te da la desviación estándar de la población ($\sigma_{x}$) porque no sabe si los datos que ingresas son una población o una muestra. Debes decidir qué valor necesitas usar, en función de si tienes una población o muestra. En casi todos los casos se tiene una muestra y se va a utilizar$s_{x}$. Además, la calculadora utiliza la notación$s_{x}$ de en lugar de solo$s$. Es sólo una manera de denotar la información. Primero debes entrar en el menú STAT, y luego Editar. Esto te permitirá escribir tus datos (ver Figura$\PageIndex{1}$).

Captura de pantalla (50) .png — Figura$\PageIndex{1}$: Configuración de edición de calculadora TI-83/84

Una vez que tenga los datos en la calculadora, vuelva al menú STAT, pase a CALC y luego elija Estadísticas 1-Var (ver Figura$\PageIndex{2}$). La calculadora ahora pondrá 1-Var Stats en la pantalla principal. Ahora escriba L2 (2do botón y 2) y luego presione ENTRAR. (Tenga en cuenta que si tiene el sistema operativo más nuevo en el TI-84, entonces el procedimiento es ligeramente diferente). Los resultados de la calculadora están en la Figura$\PageIndex{4}$.

Captura de pantalla (51) .png — Figura$\PageIndex{2}$: Menú CALC Calculadora TI-83/84

Captura de pantalla (52) .png — Figura$\PageIndex{3}$: Entrada de calculadora TI-83/84 para$\PageIndex{3}$ variable de ejemplo$X_{2}$

Captura de pantalla (53) .png — Figura$\PageIndex{4}$: Resultados de la calculadora TI-83/84 para la$\PageIndex{3}$ variable de ejemplo$X_{2}$

Los procesos para encontrar la media, mediana, rango, desviación estándar y varianza en R son los siguientes:

variable<-c (escriba sus datos)
Para encontrar la media, use mean (variable)
Para encontrar la mediana, use median (variable)
Para encontrar el rango, use range (variable). Después encuentra máximo — mínimo.
Para encontrar la desviación estándar, use sd (variable)
Para encontrar la varianza, use var (variable)

Para el segundo conjunto de datos en Ejemplo$\PageIndex{3}$, los comandos y resultados serían

productividad_2<-c (60, 58, 66, 59, 58)
media (productividad_2)
[1] 60,2
mediana (productividad_2)
[1] 59
rango (productividad_2)
[1] 58 66
sd (productividad_2)
[1] 3.34664
var ( productividad_2)
[1] 11.2

En general, una desviación estándar “pequeña” significa que los datos están muy juntos (más consistentes) y una desviación estándar “grande” significa que los datos están dispersos (menos consistentes). A veces quieres datos consistentes y a veces no. Como ejemplo si estás haciendo pernos, quieres que las longitudes sean muy consistentes por lo que quieres una pequeña desviación estándar. Si estás administrando una prueba para ver quién puede ser piloto, quieres una gran desviación estándar para que puedas saber quiénes son los buenos pilotos y quiénes son los malos.

¿Qué significan “pequeño” y “grande”? A un ciclistas cuya velocidad promedio es de 20 mph, s = 20 mph es enorme. A un avión cuya velocidad promedio es de 500 mph, s = 20 mph no es nada. El “tamaño” de la variación depende del tamaño de los números en el problema y de la media. Otra situación en la que puedes determinar si una desviación estándar es pequeña o grande es cuando estás comparando dos muestras diferentes como en el ejemplo #3 .2.3. Una muestra con una desviación estándar menor es más consistente que una muestra con una desviación estándar mayor.

Muchos otros libros y autores enfatizan que existe una fórmula computacional para calcular la desviación estándar. Sin embargo, esta fórmula no te da una idea de qué es la desviación estándar y qué estás haciendo. Sólo es bueno para hacer los cálculos rápidamente. Se remonta a los días en que las desviaciones estándar se calculaban a mano, y la persona necesitaba una forma rápida de calcular la desviación estándar. Es una fórmula arcaica que este autor está tratando de erradicarla. Ya no es necesario, ya que la mayoría de las calculadoras y computadoras harán los cálculos por ti con tanto significado como le da esta fórmula. Se sugiere que nunca lo uses. Si quieres entender lo que está haciendo la desviación estándar, entonces debes usar la fórmula de definición. Si quieres una respuesta rápida, usa una computadora o calculadora.

Uso de Desviación Estándar

Uno de los usos de la desviación estándar es describir cómo se distribuye una población usando el Teorema de Chebyshev. Este teorema funciona para cualquier distribución, ya sea sesgada, simétrica, bimodal o cualquier otra forma. Te da una idea de cuántos datos son una cierta distancia a cada lado de la media.

Definición$\PageIndex{6}$: Chebyshev's Theorem

Para cualquier conjunto de datos:

Al menos 75% de los datos caen en el intervalo de$\mu-2 \sigma \text { to } \mu+2 \sigma$.
Al menos 88.9% de los datos caen en el intervalo de$\mu-3 \sigma \text { to } \mu+3 \sigma$.
Al menos 93.8% de los datos caen en el intervalo de$\mu-4 \sigma \text { to } \mu+4 \sigma$.

Ejemplo$\PageIndex{4}$: Using Chebyshev's Theorem

La Oficina Meteorológica de Estados Unidos ha proporcionado la información en Ejemplo$\PageIndex{7}$ sobre el número anual total de tornados reportados fuertes a violentos (F3+) en Estados Unidos para los años 1954 a 2012. (“Climatología de tornados de Estados Unidos”, 17).

Tabla$\PageIndex{7}$: Número anual de tornados violentos en Estados Unidos
46	47	31	41	24	56	56	23	31	59
39	70	73	85	33	38	45	39	35	22
51	39	51	131	37	24	57	42	28	45
98	35	54	45	30	15	35	64	21	84
40	51	44	62	65	27	34	23	32	28
41	98	82	47	62	21	31	29	32

Usa el teorema de Chebyshev para encontrar un intervalo centrado en el número medio anual de tornados fuertes a violentos (F3+) en el que esperarías que caiga al menos el 75% de los años.
Usa el teorema de Chebyshev para encontrar un intervalo centrado en el número medio anual de tornados fuertes a violentos (F3+) en el que esperarías que caigan al menos 88.9% de los años.

Solución

a. variable:$x =$ número de tornados fuertes o violentos (F3+) El teorema de Chebyshev dice que al menos 75% de los datos caerán en el intervalo de$\mu-2 \sigma$ a$\mu+2 \sigma$.

No se tiene la población, por lo que es necesario estimar la media poblacional y la desviación estándar utilizando la media muestral y la desviación estándar. Puede encontrar la media de la muestra y la desviación estándar utilizando la tecnología:

$\overline{x} \approx 46.24, s \approx 22.18$

Entonces,

$\mu \approx 46.24, \sigma \approx 22.18$

$\mu-2 \sigma \text { to } \mu+2 \sigma$

$46.24-2(22.18) \text { to } 46.24+2(22.18)$

$46.24-44.36 \text { to } 46.24+44.36$

$1.88 \text { to } 90.60$

Ya que no se puede tener número fraccional de tornados, redondear al número entero más cercano.

Al menos 75% de los años tienen entre 2 y 91 tornados fuertes a violentos (F3+). (En realidad, todos los valores de menos tres años caen en este intervalo, eso significa que$\dfrac{56}{59} \approx 94.9 \%$ realmente caen en el intervalo.)

b. variable:$x =$ número de tornados fuertes o violentos (F3+) El teorema de Chebyshev dice que al menos 88.9% de los datos caerán en el intervalo de$\mu-3 \sigma$ a$\mu+3 \sigma$.

$\mu-3 \sigma \text { to } \mu+3 \sigma$

$46.24-3(22.18) \text { to } 46.24+3(22.18)$

$46.24-66.54 \text { to } 46.24+66.54$

$-20.30 \text { to } 112.78$

Como no se puede tener número negativo de tornados, el límite inferior es en realidad 0. Ya que no se puede tener número fraccional de tornados, redondear al número entero más cercano.

Al menos 88.9% de los años tienen entre 0 y 113 tornados fuertes a violentos (F3+).

(En realidad, todos menos un año cae en este intervalo, eso significa que$\dfrac{58}{59} \approx 98.3 \%$ realmente caen en el intervalo.)

El Teorema de Chebyshev dice que al menos 75% de los datos se encuentran dentro de dos desviaciones estándar de la media. Ese porcentaje es bastante alto. No hay muchos datos fuera de dos desviaciones estándar. Una regla que se puede seguir es que si un valor de datos está dentro de dos desviaciones estándar, entonces ese valor es un valor de datos común. Si el valor de los datos está fuera de dos desviaciones estándar de la media, ya sea por encima o por debajo, entonces el número es poco común. Incluso podría llamarse inusual. Un cálculo sencillo que puedes hacer para resolverlo es encontrar la diferencia entre el punto de datos y la media, y luego dividir esa respuesta por la desviación estándar. Como fórmula esto sería

$\dfrac{x-\mu}{\sigma}$.

Si no conoces la media poblacional,$\mu$, y la desviación estándar de la población$\sigma$, entonces usa la media muestral$\overline{x}$, y la desviación estándar de la muestra,$s$, para estimar los valores de los parámetros poblacionales. Sin embargo, tenga en cuenta que el uso de la desviación estándar de la muestra puede no ser realmente muy preciso.

Ejemplo$\PageIndex{5}$ determining if a value is unusual

En 1974, había 131 tornados fuertes o violentos (F3+) en Estados Unidos. ¿Este valor es inusual? ¿Por qué o por qué no?
En 1987, hubo 15 tornados fuertes o violentos (F3+) en Estados Unidos. ¿Este valor es inusual? ¿Por qué o por qué no?

Solución

a. Variable:$x =$ número de tornados fuertes o violentos (F3+)

Para responder a esta pregunta, primero encuentra cuántas desviaciones estándar 131 es de la media. De Ejemplo$\PageIndex{4}$, sabemos$\mu \approx 46.24$ y$\sigma \approx 22.18$. Para$x = 131$,

$\dfrac{x-\mu}{\sigma}=\dfrac{131-46.24}{22.18} \approx 3.82$

Dado que este valor es más de 2, entonces es inusual tener 131 tornados fuertes o violentos (F3+) en un año.

b. Variable:$x =$ número de tornados fuertes o violentos (F3+) Para esta pregunta$x = 15$,

$\dfrac{x-\mu}{\sigma}=\dfrac{15-46.24}{22.18} \approx-1.41$

Dado que este valor está entre -2 y 2, entonces no es raro tener solo 15 tornados fuertes o violentos (F3+) en un año.

Tarea

Ejercicio$\PageIndex{1}$

Los niveles de colesterol se recolectaron de los pacientes dos días después de sufrir un ataque al corazón (Ryan, Joiner & Ryan, Jr, 1985) y están en Ejemplo$\PageIndex{8}$. Encuentre la media, mediana, rango, varianza y desviación estándar usando tecnología.

Tabla$\PageIndex{8}$: Niveles de colesterol
270	236	210	142	280	272	160
220	226	242	186	266	206	318
294	282	234	224	276	282	360
310	280	278	288	288	244	236

Las longitudes (en kilómetros) de los ríos de la Isla Sur de Nueva Zelanda que fluyen hacia el Océano Pacífico se enumeran en Example$\PageIndex{9}$ (Lee, 1994).

Tabla$\PageIndex{9}$: Longitudes de ríos (km) que fluyen hacia el Océano Pacífico
Río	Longitud (km)	Río	Longitud (km)
Clarence	209	Clutha	322
Conway	48	Taieri	288
Waiau	169	Shag	72
Hurunui	138	Kakanui	64
Waipara	64	Waitaki	209
Ashley	97	Waihao	64
Waimakariri	161	Pareora	56
Selwyn	95	Rangitata	121
Rakaia	145	Ohi	80
Ashburton	90

a. Encuentra la media y la mediana.
b. Encuentra la gama.
c. Encuentra la varianza y desviación estándar.

Las longitudes (en kilómetros) de los ríos de la Isla Sur de Nueva Zelanda que fluyen hacia el Océano Pacífico se enumeran en Example$\PageIndex{9}$ (Lee, 1994).

Río	Longitud (km)	Río	Longitud (km)
Hollyford	76	Waimea	48
Cascade	64	Motueka	108
Arawhata	68	Takaka	72
Haast	64	Aorere	72
Karangarua	37	Heaphy	35
Cocinero	32	Karamea	80
Waiho	32	Mokihinui	56
Whataroa	51	Buller	177
Wanganui	56	Gris	121
Waitaha	40	Taramakau	80
Hokitika	64	Arahura	56

Cuadro$\PageIndex{10}$: Longitudes de ríos (km) que fluyen al mar de Tasmania
a. Encuentra la media y mediana.
b. Encuentra la gama.
c. Encuentra la varianza y desviación estándar.

Eyeglassmatic fabrica anteojos para sus minoristas. Prueban para ver cuántas lentes defectuosas hicieron el periodo de tiempo del 1 de enero al 31 de marzo. Ejemplo$\PageIndex{11}$ da el defecto y el número de defectos.

Tipo de defecto	Número de defectos
Rasguño	5865
Forma derecha - pequeña	4613
Descamado	1992
Eje incorrecto	1838
El chaflán está mal	1596
agrietamiento, grietas	1546
Forma incorrecta	1485
PD incorrecto	1398
Manchas y burbujas	1371
Altura incorrecta	1130
Forma derecha - grande	1105
Perdido en laboratorio	976
Manchas/Burbuja - pasante	976

Cuadro$\PageIndex{11}$: Número de lentes defectuosos
a. Encuentra la media y mediana.
b. Encuentra la gama.
c. Encuentra la varianza y desviación estándar.

Los empleados de la empresa de impresión Print-O-Matic tienen salarios que están contenidos en Ejemplo$\PageIndex{12}$. Encuentre la media, mediana, rango, varianza y desviación estándar usando tecnología.

Tabla$\PageIndex{12}$: Salarios de los empleados de Print-O-Matic Printing Company
Empleado	Sueldo ($)	Empleado	Sueldo ($)
CEO	272,500	Administración	66,346
Conductor	58,456	Ventas	109,739
CD74	100,702	Diseñador	90,090
CD65	57,380	Platinas	69,573
Embellecedor	73,877	Polar	75,526
Carpeta	65,270	ITEK	64,553
GTO	74,235	Mgmt	108,448
Gerente de Pre Prensa	108,448	Trabajo hecho a mano	52,718
Gerente de Pre Prensa/IT	98.837	Horizon	76,029
Pre Prensa/Artista Gráfico	75,311

Imprint-O-Matic empresa de impresión gasta montos específicos en costos fijos cada mes. Los costos de esos costos fijos están en Ejemplo$\PageIndex{13}$.

Tabla$\PageIndex{13}$: Costos fijos para Imprint-O-Matic Printing Company
Cargos mensuales	Costo mensual ($)
Cargos bancarios	482
Limpieza	2208
Computadora cara	2471
Pagos de arrendamiento	2656
Franqueo	2117
Uniformes	2600

a. Encuentra la media y la mediana.
b. Encuentra la gama.
c. Encuentra la varianza y desviación estándar.

Comparar los dos conjuntos de datos en los problemas 2 y 3 usando la media y la desviación estándar. Discutir cuál es la media más alta y cuál tiene una mayor dispersión de los datos.

Ejemplo$\PageIndex{14}$ contiene las frecuencias de pulso recolectadas de machos, que son no fumadores pero sí beben alcohol (“Pulso antes”, 2013). La frecuencia del pulso anterior es antes de que ejercitaran, y la frecuencia del pulso posterior se tomó después de que el sujeto corriera en su lugar durante un minuto. Compare los dos conjuntos de datos usando la media y la desviación estándar. Discutir cuál es la media más alta y cuál tiene una mayor dispersión de los datos.

Tabla$\PageIndex{14}$: Pulso de varones antes y después del ejercicio
Pulso antes	Pulso después	Pulso antes	Pulso después
76	88	59	92
56	110	60	104
64	126	65	82
50	90	76	150
49	83	145	155
68	136	84	140
68	125	78	141
88	150	85	131
80	146	78	132
78	168

Ejemplo$\PageIndex{15}$ contiene las frecuencias de pulso recolectadas de hembras, que son no fumadoras pero sí beben alcohol (“Pulso antes”, 2013). La frecuencia del pulso anterior es antes de que ejercitaran, y la frecuencia del pulso posterior se tomó después de que el sujeto corriera en su lugar durante un minuto. Compare los dos conjuntos de datos usando la media y la desviación estándar. Discutir cuál es la media más alta y cuál tiene una mayor dispersión de los datos.

Tabla$\PageIndex{15}$: Pulso de las hembras antes y después del ejercicio
Pulso antes	Pulso después	Pulso antes	Pulso después
96	176	92	120
82	150	70	96
86	150	75	130
72	115	70	119
78	129	70	95
90	160	68	84
88	120	47	136
71	125	64	120
66	89	70	98
76	132	74	168
70	120	85	130

Para determinar si el Reiki es un método efectivo para tratar el dolor, se realizó un estudio piloto donde un terapeuta de Reiki certificado de segundo grado brindó tratamiento a voluntarios. El dolor se midió usando una escala visual analógica (VAS) inmediatamente antes y después del tratamiento de Reiki (Olson & Hanson, 1997) y los datos están en Ejemplo$\PageIndex{16}$. Compare los dos conjuntos de datos usando la media y la desviación estándar. Discutir cuál es la media más alta y cuál tiene una mayor dispersión de los datos.

Tabla$\PageIndex{16}$: Medidas del dolor antes y después del tratamiento de Reiki
VAS antes	VAS después	VAS antes	VAS después
6	3	5	1
2	1	1	0
2	0	6	4
9	1	6	1
3	0	4	4
3	2	4	1
4	1	7	6
5	2	2	1
2	2	4	3
3	0	8	8

Ejemplo$\PageIndex{17}$ contiene datos recopilados sobre el tiempo que toma en segundos de cada paso de juego en una partida de rugby. (“Tiempo de los pasajes”, 2013)

Tabla$\PageIndex{17}$: Tiempos (en segundos) de jugadas de rugby
39.2	2.7	9.2	14.6	1.9	17.8	15.5	53.8	17.5	27.5
4.8	8.6	22.1	29.8	10.4	9.8	27.7	32.7	32	34.3
29.1	6.5	2.8	10.8	9.2	12.9	7.1	23.8	7.6	36.4
35.6	28.4	37.2	16.8	21.2	14.7	44.5	24.7	36.2	20.9
19.9	24.4	7.9	2.8	2.7	3.9	14.1	28.4	45.5	38
18.5	8.3	56.2	10.2	5.5	2.5	46.8	23.1	9.2	10.3
10.2	22	28.5	24	17.3	12.7	15.5	4	5.6	3.8
21.6	49.3	52.4	50.1	30.5	37.2	15	38.7	3.1	11
10	5	48.8	3.6	12.6	9.9	58.6	37.9	19.4	29.2
12.3	39.2	22.2	39.7	6.4	2.5	34

a. Utilizando la tecnología, encontrar la media y la desviación estándar.
b. Usa el teorema de Chebyshev para encontrar un intervalo centrado en los tiempos medios de cada paso de juego en el juego de rugby en el que esperarías que caigan al menos 75% de los tiempos.
c. Usa el teorema de Chebyshev para encontrar un intervalo centrado en los tiempos medios de cada paso de juego en el juego de rugby en el que esperarías que caigan al menos 88.9% de los tiempos.

Las cantidades anuales de lluvia (en milímetros) en Sydney, Australia, se encuentran en la tabla #3 .2.18 (“Máximo anual de,” 2013).

Tabla$\PageIndex{18}$: Cantidades anuales de lluvia en Sydney, Australia
146.8	383	90.9	178.1	267.5	95.5	156.5	180
90.9	139.7	200.2	171.7	187.2	184.9	70.1	58
84.1	55.6	133.1	271.8	135.9	71.9	99.4	110.6
47.5	97.8	122.7	58.4	154.4	173.7	118.8	88
84.6	171.5	254.3	185.9	137.2	138.9	96.2	85
45.2	74.7	264.9	113.8	133.4	68.1	156.4

a. Utilizando la tecnología, encontrar la media y la desviación estándar.
b. use el teorema de Chebyshev para encontrar un intervalo centrado en las cantidades medias anuales de lluvia en Sydney, Australia, en el que se esperaría que al menos el 75% de las cantidades cayeran.
c. Usa el teorema de Chebyshev para encontrar un intervalo centrado en las cantidades medias anuales de lluvia en Sydney, Australia, en el que esperarías que caigan al menos 88.9% de las cantidades.

El número de muertes atribuidas a la radiación UV en los países africanos en el año 2002 se da en Ejemplo$\PageIndex{19}$ (“Radiación UV: Burden”, 2013).

Tabla$\PageIndex{19}$: Número de muertes por radiación UV
50	84	31	338	6	504	40	7	58
204	15	27	39	1	45	174	98	94
199	9	27	58	356	5	45	5	94
26	171	13	57	138	39	3	171	41
1177	102	123	433	35	40	456	125

a. Utilizando la tecnología, encontrar la media y la desviación estándar.
b. use el teorema de Chebyshev para encontrar un intervalo centrado en el número medio de muertes por radiación UV en el que se esperaría que al menos 75% de los números cayeran.
c. Usa el teorema de Chebyshev para encontrar un intervalo centrado en el número medio de muertes por radiación UV en el que se esperaría que al menos el 88.9% de los números cayeran.

El tiempo (en 1/50 segundos) entre pulsos sucesivos a lo largo de una fibra nerviosa (“Tiempo entre nervio”, 2013) se dan en Ejemplo$\PageIndex{20}$.

Tabla$\PageIndex{20}$: Tiempo (en 1/50 segundos) entre pulsos sucesivos
10.5	1.5	2.5	5.5	29.5	3	9	27.5	18.5	4.5
7	9.5	1	7	4.5	2.5	7.5	11.5	7.5	4
12	8	3	5.5	7.5	4.5	1.5	10.5	1	7
12	14.5	8	3.5	3.5	2	1	7.5	6	13
7.5	16.5	3	25.5	5.5	14	18	7	27.5	14

a. Utilizando la tecnología, encontrar la media y la desviación estándar.
b. Usa el teorema de Chebyshev para encontrar un intervalo centrado en el tiempo medio entre pulsos sucesivos a lo largo de una fibra nerviosa en el que esperarías que caigan al menos 75% de los tiempos.
c. Usa el teorema de Chebyshev para encontrar un intervalo centrado en el tiempo medio entre pulsos sucesivos a lo largo de una fibra nerviosa en el que esperarías que caigan al menos 88.9% de los tiempos.

Supongamos que un paso de juego en un juego de rugby toma 75.1 segundos. ¿Sería inusual que esto sucediera? Usa la media y desviación estándar que calculaste en el problema 11.
Supongamos que Sydney, Australia recibió 300 mm de lluvia en un año. ¿Sería esto inusual? Usa la media y desviación estándar que calculaste en el problema 12.
Supongamos que en un año determinado hubo 2257 muertes atribuidas a la radiación UV en un país africano. ¿Este valor es inusual? Usa la media y desviación estándar que calculaste en el problema 13.
Supongamos que solo toma 2 (1/50 segundos) para pulsos sucesivos a lo largo de una fibra nerviosa. ¿Este valor es inusual? Usa la media y desviación estándar que calculaste en el problema 14.

Contestar

1. media = 253.93, mediana = 268, rango = 218, varianza = 2276.29, st dev = 47.71

3. a. media = 67.68 km, mediana = 64 km, b. rango = 145 km, c. varianza = 1107.9416$\mathrm{km}^{2}$, st dev = 33.29 km

5. media = $89.370.42, mediana = $75.311, rango = $219.782, varianza =2298639399, st dev = $47,944.13

7. Ver soluciones

9. $\overline{x}_{1} \approx 75.45, s_{1} \approx 11.10, \overline{x}_{2} \approx 125.55, s_{2} \approx 24.72$

11. a.$\overline{x} \approx 21.24 \mathrm{sec}, s \approx 14.95 \mathrm{sec}$ b.$(-8.66 \mathrm{sec}, 51.14 \mathrm{sec})$ c.$(-23.61 \mathrm{sec}, 66.09 \mathrm{sec})$

13. a.$\overline{x} \approx 130.98, s \approx 205.44$ b.$(-279.90,541.86)$ c.$(-485.34,747.3)$

15. 3.61

17. 10.35

46	47	31	41	24	56	56	23	31	59
39	70	73	85	33	38	45	39	35	22
51	39	51	131	37	24	57	42	28	45
98	35	54	45	30	15	35	64	21	84
40	51	44	62	65	27	34	23	32	28
41	98	82	47	62	21	31	29	32

270	236	210	142	280	272	160
220	226	242	186	266	206	318
294	282	234	224	276	282	360
310	280	278	288	288	244	236

Pulso antes	Pulso después	Pulso antes	Pulso después
76	88	59	92
56	110	60	104
64	126	65	82
50	90	76	150
49	83	145	155
68	136	84	140
68	125	78	141
88	150	85	131
80	146	78	132
78	168

Pulso antes	Pulso después	Pulso antes	Pulso después
96	176	92	120
82	150	70	96
86	150	75	130
72	115	70	119
78	129	70	95
90	160	68	84
88	120	47	136
71	125	64	120
66	89	70	98
76	132	74	168
70	120	85	130

46	47	31	41	24	56	56	23	31	59
39	70	73	85	33	38	45	39	35	22
51	39	51	131	37	24	57	42	28	45
98	35	54	45	30	15	35	64	21	84
40	51	44	62	65	27	34	23	32	28
41	98	82	47	62	21	31	29	32

270	236	210	142	280	272	160
220	226	242	186	266	206	318
294	282	234	224	276	282	360
310	280	278	288	288	244	236

Pulso antes	Pulso después	Pulso antes	Pulso después
76	88	59	92
56	110	60	104
64	126	65	82
50	90	76	150
49	83	145	155
68	136	84	140
68	125	78	141
88	150	85	131
80	146	78	132
78	168

Pulso antes	Pulso después	Pulso antes	Pulso después
96	176	92	120
82	150	70	96
86	150	75	130
72	115	70	119
78	129	70	95
90	160	68	84
88	120	47	136
71	125	64	120
66	89	70	98
76	132	74	168
70	120	85	130

46	47	31	41	24	56	56	23	31	59
39	70	73	85	33	38	45	39	35	22
51	39	51	131	37	24	57	42	28	45
98	35	54	45	30	15	35	64	21	84
40	51	44	62	65	27	34	23	32	28
41	98	82	47	62	21	31	29	32

270	236	210	142	280	272	160
220	226	242	186	266	206	318
294	282	234	224	276	282	360
310	280	278	288	288	244	236

Pulso antes	Pulso después	Pulso antes	Pulso después
76	88	59	92
56	110	60	104
64	126	65	82
50	90	76	150
49	83	145	155
68	136	84	140
68	125	78	141
88	150	85	131
80	146	78	132
78	168

Pulso antes	Pulso después	Pulso antes	Pulso después
96	176	92	120
82	150	70	96
86	150	75	130
72	115	70	119
78	129	70	95
90	160	68	84
88	120	47	136
71	125	64	120
66	89	70	98
76	132	74	168
70	120	85	130