Saltar al contenido principal
LibreTexts Español

3.2: Medidas de propagación

  • Page ID
    149651
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    La variabilidad es una idea importante en la estadística. Si tuvieras que medir la altura de todos en tu salón de clases, cada observación te da un valor diferente. Eso significa que no todos los estudiantes tienen la misma altura. Así, existe variabilidad en las alturas de las personas. Si tuvieras que tomar una muestra del nivel de ingresos de las personas en un pueblo, cada muestra te da información diferente. También hay variabilidad entre muestras. La variabilidad describe cómo se distribuyen los datos. Si los datos están muy cerca unos de otros, entonces hay poca variabilidad. Si los datos están muy dispersos, entonces hay una alta variabilidad. ¿Cómo se mide la variabilidad? Sería bueno tener un número que lo mida. En esta sección se describirán algunas de las diferentes medidas de variabilidad, también conocidas como variación.

    En Ejemplo\(\PageIndex{1}\), se calculó que el peso promedio de un gato era de 8.02 libras. ¿Cuánto te dice esto del peso de todos los gatos? ¿Se puede decir si la mayoría de los pesos estaban cerca de 8.02 o los pesos estaban realmente distribuidos? ¿Cuáles son el peso más alto y el peso más bajo? Todo lo que sabes es que el centro de los pesos es de 8.02 libras. Necesitas más información.

    Definición\(\PageIndex{1}\)

    El rango de un conjunto de datos es la diferencia entre los valores de datos más altos y los más bajos (o valores máximos y mínimos).

    \[\begin{align*} \text{Range} &= \text{highest value} - \text{lowest value} \\[4pt] &= \text{maximum value} - \text{minimum value} \end{align*}\]

    Ejemplo\(\PageIndex{1}\): Finding the Range

    Mira los siguientes tres conjuntos de datos. Encuentra la gama de cada uno de estos.

    1. \(10, 20, 30, 40, 50\)
    2. \(10, 29, 30, 31, 50\)
    3. \(28, 29, 30, 31, 32\)

    Solución

    a.

    Captura de pantalla (47) .png
    Figura\(\PageIndex{1}\): Gráfica de puntos para el Ejemplo\(\PageIndex{1}\) a

    b.

    Captura de pantalla (48) .png
    Figura\(\PageIndex{2}\): Gráfica de puntos para el Ejemplo\(\PageIndex{1}\) b

    c.

    Captura de pantalla (49) .png
    Figura\(\PageIndex{3}\): Gráfica de puntos por ejemplo\(\PageIndex{1}\)

    Con base en la media, mediana y rango en Ejemplo\(\PageIndex{1}\), las dos primeras distribuciones son las mismas, pero se puede ver en las gráficas que son diferentes. En el Ejemplo\(\PageIndex{1}\) a los datos se distribuyen por igual. En el Ejemplo\(\PageIndex{1}\) b los datos tienen un clump en el medio y un solo valor en cada extremo. La media y la mediana son las mismas para el Ejemplo\(\PageIndex{1}\) c pero el rango es muy diferente. Todos los datos se agrupan en el medio.

    El rango realmente no proporciona una imagen muy precisa de la variabilidad. Se necesita una mejor manera de describir cómo se distribuyen los datos. En lugar de mirar la distancia el valor más alto es desde el más bajo ¿qué tal si se mira a la distancia cada valor es de la media? Esta distancia se llama la desviación.

    Ejemplo\(\PageIndex{2}\): Finding the Deviations

    Supongamos que un veterinario quiere analizar los pesos de los gatos. Los pesos (en libras) de cinco gatos son 6.8, 8.2, 7.5, 9.4 y 8.2. Encuentra la desviación para cada uno de los valores de datos.

    Solución

    Variable:\(x=\) peso de un gato

    La media para este conjunto de datos es\(\overline{x}=8.02\) libras.

    \(x\) \(x-\overline{x}\)
    \ (x\) ">6.8 \ (x-\ overline {x}\) ">6.8-8.02 = -1.22
    \ (x\) ">8.2 \ (x-\ overline {x}\) ">8.2-8.02=0.18
    \ (x\) ">7.5 \ (x-\ overline {x}\) ">7.5-8.02=-0.52
    \ (x\) ">9.4 \ (x-\ overline {x}\) ">9.4-8.02=1.38
    \ (x\) ">8.2 \ (x-\ overline {x}\) ">8.2-8.02=0.18
    Tabla\(\PageIndex{1}\): Desviaciones de Pesos de Gatos

    Ahora es posible que desee promediar la desviación, por lo que debe sumar las desviaciones juntas.

    \(x\) \(x-\overline{x}\)
    \ (x\) ">6.8 \ (x-\ overline {x}\) ">6.8-8.02 = -1.22
    \ (x\) ">8.2 \ (x-\ overline {x}\) ">8.2-8.02=0.18
    \ (x\) ">7.5 \ (x-\ overline {x}\) ">7.5-8.02=-0.52
    \ (x\) ">9.4 \ (x-\ overline {x}\) ">9.4-8.02=1.38
    \ (x\) ">8.2 \ (x-\ overline {x}\) ">8.2-8.02=0.18
    \ (x\) ">Total \ (x-\ overline {x}\) ">0
    Tabla\(\PageIndex{2}\): Suma de Desviaciones de Pesos de Gatos

    Esto no puede estar bien. La distancia promedio desde la media no puede ser 0. La razón por la que se suma a 0 es porque hay algunos valores positivos y negativos. Necesitas deshacerte de los signos negativos. ¿Cómo puedes hacer eso? Podrías cuadrar cada desviación.

    \(x\) \(x-\overline{x}\) \((x-\overline{x})^{2}\)
    \ (x\) ">6.8 \ (x-\ overline {x}\) ">6.8-8.02 = -1.22 \ ((x-\ overline {x}) ^ {2}\) ">1.4884
    \ (x\) ">8.2 \ (x-\ overline {x}\) ">8.2-8.02=0.18 \ ((x-\ overline {x}) ^ {2}\) ">0.0324
    \ (x\) ">7.5 \ (x-\ overline {x}\) ">7.5-8.02=-0.52 \ ((x-\ overline {x}) ^ {2}\) ">0.2704
    \ (x\) ">9.4 \ (x-\ overline {x}\) ">9.4-8.02=1.38 \ ((x-\ overline {x}) ^ {2}\) ">1.9044
    \ (x\) ">8.2 \ (x-\ overline {x}\) ">8.2-8.02=0.18 \ ((x-\ overline {x}) ^ {2}\) ">0.0324
    \ (x\) ">Total \ (x-\ overline {x}\) ">0 \ ((x-\ overline {x}) ^ {2}\) ">3.728
    Tabla\(\PageIndex{3}\): Desviaciones Cuadradas de Pesos de Gatos

    Ahora promedia el total de las desviaciones cuadradas. Lo único es que en las estadísticas hay un promedio extraño aquí. En lugar de dividir por el número de valores de datos se divide por el número de valores de datos menos 1. En este caso tendrías

    \(s^{2}=\dfrac{3.728}{5-1}=\dfrac{3.728}{4}=0.932 \text { pounds }^{2}\)

    Observe que esto se denota como\(s^{2}\). Esto se llama varianza y es una medida de la distancia cuadrada promedio desde la media. Si ahora tomas la raíz cuadrada, obtendrás la distancia promedio de la media. Esto se llama la desviación estándar, y se denota con la letra\(s\).

    \(s=\sqrt{.932} \approx 0.965\)libras

    La desviación estándar es la distancia promedio (media) de un punto de datos a la media. Se puede pensar en cuánto difiere un punto de datos típico de la media.

    Definición\(\PageIndex{2}\): Sample Variance

    La fórmula de varianza muestral:

    \(s^{2}=\dfrac{\sum(x-\overline{x})^{2}}{n-1}\)

    donde\(\overline{x}\) es la media de la muestra,\(n\) es el tamaño de la muestra, y\(\sum\) medias para encontrar la suma.

    Definición\(\PageIndex{3}\): Sample Standard Deviation

    La fórmula de desviación estándar de la muestra:

    \(s=\sqrt{s^{2}}=\sqrt{\dfrac{\sum(x-\overline{x})^{2}}{n-1}}\)

    El\(n-1\) de abajo tiene que ver con un concepto llamado grados de libertad. Básicamente, hace que la desviación estándar de la muestra sea una mejor aproximación de la desviación estándar de la población.

    Definición\(\PageIndex{4}\): Population Variance

    La fórmula de varianza poblacional:

    \(\sigma^{2}=\dfrac{\sum(x-\mu)^{2}}{N}\)

    donde\(\sigma\) es la letra griega sigma y\(\sigma^{2}\) representa la varianza poblacional,\(\mu\) es la media poblacional, y N es el tamaño de la población.

    Definición\(\PageIndex{5}\): Population Standard Deviation

    La fórmula de desviación estándar poblacional:

    \(\sigma=\sqrt{\sigma^{2}}=\sqrt{\dfrac{\sum(x-\mu)^{2}}{N}}\)

    Nota

    La suma de las desviaciones siempre debe ser 0. Si no lo es, entonces es porque redondeaste, usaste la mediana en lugar de la media, o cometiste un error. Trate de no redondear demasiado en los cálculos para la desviación estándar ya que cada redondeo causa un ligero error

    Ejemplo\(\PageIndex{3}\): Finding the Standard Deviation

    Supongamos que un directivo quiere probar dos nuevos programas de capacitación. Selecciona al azar a 5 personas por cada tipo de entrenamiento y mide el tiempo que lleva completar una tarea después del entrenamiento. Los tiempos para ambos entrenamientos están en Ejemplo\(\PageIndex{4}\). ¿Qué método de entrenamiento es mejor?

    Entrenamiento 1 56 75 48 63 59
    Entrenamiento 2 60 58 66 59 58
    Tabla\(\PageIndex{4}\): Tiempo para terminar la tarea en minutos

    Solución

    Es importante que definas qué es cada variable ya que hay dos de ellas.

    Variable 1:\(X_{1}=\) productividad desde el entrenamiento 1

    Variable 2:\(X_{2}=\) productividad del entrenamiento 2

    Para responder qué método de entrenamiento mejor, primero necesitas algunas estadísticas descriptivas. Comience con la media para cada muestra.

    \(\overline{x}_{1}=\dfrac{56+75+48+63+59}{5}=60.2\)minutos

    \(\overline{x}_{2}=\dfrac{60+58+66+59+58}{5}=60.2\)minutos

    Dado que ambos medios son los mismos valores, no se puede responder a la pregunta sobre cuál es mejor. Ahora calcule la desviación estándar para cada muestra.

    \(x_{1}\) \(x_{1}-\overline{x}_{1}\) \(\left(x_{1}-\overline{x}_{1}\right)^{2}\)
    \ (x_ {1}\) ">56 \ (x_ {1} -\ overline {x} _ {1}\) ">-4.2 \ (\ izquierda (x_ {1} -\ overline {x} _ {1}\ derecha) ^ {2}\) ">17.64
    \ (x_ {1}\) ">75 \ (x_ {1} -\ overline {x} _ {1}\) ">14.8 \ (\ izquierda (x_ {1} -\ overline {x} _ {1}\ derecha) ^ {2}\) ">219.04
    \ (x_ {1}\) ">48 \ (x_ {1} -\ overline {x} _ {1}\) ">-12.2 \ (\ izquierda (x_ {1} -\ overline {x} _ {1}\ derecha) ^ {2}\) ">148.84
    \ (x_ {1}\) ">63 \ (x_ {1} -\ overline {x} _ {1}\) ">2.8 \ (\ izquierda (x_ {1} -\ overline {x} _ {1}\ derecha) ^ {2}\) ">7.84
    \ (x_ {1}\) ">59 \ (x_ {1} -\ overline {x} _ {1}\) ">-1.2 \ (\ izquierda (x_ {1} -\ overline {x} _ {1}\ derecha) ^ {2}\) ">1.44
    \ (x_ {1}\) ">Total \ (x_ {1} -\ overline {x} _ {1}\) ">0 \ (\ izquierda (x_ {1} -\ overline {x} _ {1}\ derecha) ^ {2}\) ">394.8
    Tabla\(\PageIndex{5}\): Desviaciones Cuadradas para Entrenamiento 1
    \(x_{2}\) \(x_{2}-\overline{x}_{2}\) \(\left(x_{2}-\overline{x}_{2}\right)^{2}\)
    \ (x_ {2}\) ">60 \ (x_ {2} -\ overline {x} _ {2}\) ">-0.2 \ (\ izquierda (x_ {2} -\ overline {x} _ {2}\ derecha) ^ {2}\) ">0.04
    \ (x_ {2}\) ">58 \ (x_ {2} -\ overline {x} _ {2}\) ">-2.2 \ (\ izquierda (x_ {2} -\ overline {x} _ {2}\ derecha) ^ {2}\) ">4.84
    \ (x_ {2}\) ">66 \ (x_ {2} -\ overline {x} _ {2}\) ">5.8 \ (\ izquierda (x_ {2} -\ overline {x} _ {2}\ derecha) ^ {2}\) ">33.64
    \ (x_ {2}\) ">59 \ (x_ {2} -\ overline {x} _ {2}\) ">-1.2 \ (\ izquierda (x_ {2} -\ overline {x} _ {2}\ derecha) ^ {2}\) ">1.44
    \ (x_ {2}\) ">58 \ (x_ {2} -\ overline {x} _ {2}\) ">-2.2 \ (\ izquierda (x_ {2} -\ overline {x} _ {2}\ derecha) ^ {2}\) ">4.84
    \ (x_ {2}\) ">Total \ (x_ {2} -\ overline {x} _ {2}\) ">0 \ (\ izquierda (x_ {2} -\ overline {x} _ {2}\ derecha) ^ {2}\) ">44.8
    Tabla\(\PageIndex{6}\): Desviaciones Cuadradas para Entrenamiento 2

    La varianza para cada muestra es:

    \(s_{1}^{2}=\dfrac{394.8}{5-1}=98.7 \text { minutes }^{2}\)

    \(s_{2}^{2}=\dfrac{44.8}{5-1}=11.2 \text { minutes }^{2}\)

    Las desviaciones estándar son:

    \(s_{1}=\sqrt{98.7} \approx 9.93\)minutos

    \(s_{2}=\sqrt{11.2} \approx 3.35\)minutos

    A partir de las desviaciones estándar, el segundo entrenamiento parecía ser el mejor entrenamiento ya que los datos están menos dispersos. Esto quiere decir que es más consistente. Sería mejor para los directivos en este caso contar con un programa de capacitación que produzca resultados más consistentes para que sepan qué esperar del tiempo que lleva completar la tarea.

    Se pueden hacer los cálculos para las estadísticas descriptivas utilizando la tecnología. El procedimiento para calcular la media muestral (\(\overline{x}) \)y la desviación estándar de la muestra (\(s_{x}\)) para\(X_{2}\) en el Ejemplo\(\PageIndex{3}\) sobre el TI-83/84 se encuentra en las Figuras 3.2.1 a 3.2.4 (el procedimiento es el mismo para\(X_{1}\)). Ten en cuenta que la calculadora te da la desviación estándar de la población (\(\sigma_{x}\)) porque no sabe si los datos que ingresas son una población o una muestra. Debes decidir qué valor necesitas usar, en función de si tienes una población o muestra. En casi todos los casos se tiene una muestra y se va a utilizar\(s_{x}\). Además, la calculadora utiliza la notación\(s_{x}\) de en lugar de solo\(s\). Es sólo una manera de denotar la información. Primero debes entrar en el menú STAT, y luego Editar. Esto te permitirá escribir tus datos (ver Figura\(\PageIndex{1}\)).

    Captura de pantalla (50) .png
    Figura\(\PageIndex{1}\): Configuración de edición de calculadora TI-83/84

    Una vez que tenga los datos en la calculadora, vuelva al menú STAT, pase a CALC y luego elija Estadísticas 1-Var (ver Figura\(\PageIndex{2}\)). La calculadora ahora pondrá 1-Var Stats en la pantalla principal. Ahora escriba L2 (2do botón y 2) y luego presione ENTRAR. (Tenga en cuenta que si tiene el sistema operativo más nuevo en el TI-84, entonces el procedimiento es ligeramente diferente). Los resultados de la calculadora están en la Figura\(\PageIndex{4}\).

    Captura de pantalla (51) .png
    Figura\(\PageIndex{2}\): Menú CALC Calculadora TI-83/84
    Captura de pantalla (52) .png
    Figura\(\PageIndex{3}\): Entrada de calculadora TI-83/84 para\(\PageIndex{3}\) variable de ejemplo\(X_{2}\)
    Captura de pantalla (53) .png
    Figura\(\PageIndex{4}\): Resultados de la calculadora TI-83/84 para la\(\PageIndex{3}\) variable de ejemplo\(X_{2}\)

    Los procesos para encontrar la media, mediana, rango, desviación estándar y varianza en R son los siguientes:

    variable<-c (escriba sus datos)
    Para encontrar la media, use mean (variable)
    Para encontrar la mediana, use median (variable)
    Para encontrar el rango, use range (variable). Después encuentra máximo — mínimo.
    Para encontrar la desviación estándar, use sd (variable)
    Para encontrar la varianza, use var (variable)

    Para el segundo conjunto de datos en Ejemplo\(\PageIndex{3}\), los comandos y resultados serían

    productividad_2<-c (60, 58, 66, 59, 58)
    media (productividad_2)
    [1] 60,2
    mediana (productividad_2)
    [1] 59
    rango (productividad_2)
    [1] 58 66
    sd (productividad_2)
    [1] 3.34664
    var ( productividad_2)
    [1] 11.2

    En general, una desviación estándar “pequeña” significa que los datos están muy juntos (más consistentes) y una desviación estándar “grande” significa que los datos están dispersos (menos consistentes). A veces quieres datos consistentes y a veces no. Como ejemplo si estás haciendo pernos, quieres que las longitudes sean muy consistentes por lo que quieres una pequeña desviación estándar. Si estás administrando una prueba para ver quién puede ser piloto, quieres una gran desviación estándar para que puedas saber quiénes son los buenos pilotos y quiénes son los malos.

    ¿Qué significan “pequeño” y “grande”? A un ciclistas cuya velocidad promedio es de 20 mph, s = 20 mph es enorme. A un avión cuya velocidad promedio es de 500 mph, s = 20 mph no es nada. El “tamaño” de la variación depende del tamaño de los números en el problema y de la media. Otra situación en la que puedes determinar si una desviación estándar es pequeña o grande es cuando estás comparando dos muestras diferentes como en el ejemplo #3 .2.3. Una muestra con una desviación estándar menor es más consistente que una muestra con una desviación estándar mayor.

    Muchos otros libros y autores enfatizan que existe una fórmula computacional para calcular la desviación estándar. Sin embargo, esta fórmula no te da una idea de qué es la desviación estándar y qué estás haciendo. Sólo es bueno para hacer los cálculos rápidamente. Se remonta a los días en que las desviaciones estándar se calculaban a mano, y la persona necesitaba una forma rápida de calcular la desviación estándar. Es una fórmula arcaica que este autor está tratando de erradicarla. Ya no es necesario, ya que la mayoría de las calculadoras y computadoras harán los cálculos por ti con tanto significado como le da esta fórmula. Se sugiere que nunca lo uses. Si quieres entender lo que está haciendo la desviación estándar, entonces debes usar la fórmula de definición. Si quieres una respuesta rápida, usa una computadora o calculadora.

    Uso de Desviación Estándar

    Uno de los usos de la desviación estándar es describir cómo se distribuye una población usando el Teorema de Chebyshev. Este teorema funciona para cualquier distribución, ya sea sesgada, simétrica, bimodal o cualquier otra forma. Te da una idea de cuántos datos son una cierta distancia a cada lado de la media.

    Definición\(\PageIndex{6}\): Chebyshev's Theorem

    Para cualquier conjunto de datos:

    • Al menos 75% de los datos caen en el intervalo de\(\mu-2 \sigma \text { to } \mu+2 \sigma\).
    • Al menos 88.9% de los datos caen en el intervalo de\(\mu-3 \sigma \text { to } \mu+3 \sigma\).
    • Al menos 93.8% de los datos caen en el intervalo de\(\mu-4 \sigma \text { to } \mu+4 \sigma\).

    Ejemplo\(\PageIndex{4}\): Using Chebyshev's Theorem

    La Oficina Meteorológica de Estados Unidos ha proporcionado la información en Ejemplo\(\PageIndex{7}\) sobre el número anual total de tornados reportados fuertes a violentos (F3+) en Estados Unidos para los años 1954 a 2012. (“Climatología de tornados de Estados Unidos”, 17).

    46 47 31 41 24 56 56 23 31 59
    39 70 73 85 33 38 45 39 35 22
    51 39 51 131 37 24 57 42 28 45
    98 35 54 45 30 15 35 64 21 84
    40 51 44 62 65 27 34 23 32 28
    41 98 82 47 62 21 31 29 32
    Tabla\(\PageIndex{7}\): Número anual de tornados violentos en Estados Unidos
    1. Usa el teorema de Chebyshev para encontrar un intervalo centrado en el número medio anual de tornados fuertes a violentos (F3+) en el que esperarías que caiga al menos el 75% de los años.
    2. Usa el teorema de Chebyshev para encontrar un intervalo centrado en el número medio anual de tornados fuertes a violentos (F3+) en el que esperarías que caigan al menos 88.9% de los años.

    Solución

    a. variable:\(x =\) número de tornados fuertes o violentos (F3+) El teorema de Chebyshev dice que al menos 75% de los datos caerán en el intervalo de\(\mu-2 \sigma\) a\(\mu+2 \sigma\).

    No se tiene la población, por lo que es necesario estimar la media poblacional y la desviación estándar utilizando la media muestral y la desviación estándar. Puede encontrar la media de la muestra y la desviación estándar utilizando la tecnología:

    \(\overline{x} \approx 46.24, s \approx 22.18\)

    Entonces,

    \(\mu \approx 46.24, \sigma \approx 22.18\)

    \(\mu-2 \sigma \text { to } \mu+2 \sigma\)

    \(46.24-2(22.18) \text { to } 46.24+2(22.18)\)

    \(46.24-44.36 \text { to } 46.24+44.36\)

    \(1.88 \text { to } 90.60\)

    Ya que no se puede tener número fraccional de tornados, redondear al número entero más cercano.

    Al menos 75% de los años tienen entre 2 y 91 tornados fuertes a violentos (F3+). (En realidad, todos los valores de menos tres años caen en este intervalo, eso significa que\(\dfrac{56}{59} \approx 94.9 \%\) realmente caen en el intervalo.)

    b. variable:\(x =\) número de tornados fuertes o violentos (F3+) El teorema de Chebyshev dice que al menos 88.9% de los datos caerán en el intervalo de\(\mu-3 \sigma\) a\(\mu+3 \sigma\).

    \(\mu-3 \sigma \text { to } \mu+3 \sigma\)

    \(46.24-3(22.18) \text { to } 46.24+3(22.18)\)

    \(46.24-66.54 \text { to } 46.24+66.54\)

    \(-20.30 \text { to } 112.78\)

    Como no se puede tener número negativo de tornados, el límite inferior es en realidad 0. Ya que no se puede tener número fraccional de tornados, redondear al número entero más cercano.

    Al menos 88.9% de los años tienen entre 0 y 113 tornados fuertes a violentos (F3+).

    (En realidad, todos menos un año cae en este intervalo, eso significa que\(\dfrac{58}{59} \approx 98.3 \%\) realmente caen en el intervalo.)

    El Teorema de Chebyshev dice que al menos 75% de los datos se encuentran dentro de dos desviaciones estándar de la media. Ese porcentaje es bastante alto. No hay muchos datos fuera de dos desviaciones estándar. Una regla que se puede seguir es que si un valor de datos está dentro de dos desviaciones estándar, entonces ese valor es un valor de datos común. Si el valor de los datos está fuera de dos desviaciones estándar de la media, ya sea por encima o por debajo, entonces el número es poco común. Incluso podría llamarse inusual. Un cálculo sencillo que puedes hacer para resolverlo es encontrar la diferencia entre el punto de datos y la media, y luego dividir esa respuesta por la desviación estándar. Como fórmula esto sería

    \(\dfrac{x-\mu}{\sigma}\).

    Si no conoces la media poblacional,\(\mu\), y la desviación estándar de la población\(\sigma\), entonces usa la media muestral\(\overline{x}\), y la desviación estándar de la muestra,\(s\), para estimar los valores de los parámetros poblacionales. Sin embargo, tenga en cuenta que el uso de la desviación estándar de la muestra puede no ser realmente muy preciso.

    Ejemplo\(\PageIndex{5}\) determining if a value is unusual

    1. En 1974, había 131 tornados fuertes o violentos (F3+) en Estados Unidos. ¿Este valor es inusual? ¿Por qué o por qué no?
    2. En 1987, hubo 15 tornados fuertes o violentos (F3+) en Estados Unidos. ¿Este valor es inusual? ¿Por qué o por qué no?

    Solución

    a. Variable:\(x =\) número de tornados fuertes o violentos (F3+)

    Para responder a esta pregunta, primero encuentra cuántas desviaciones estándar 131 es de la media. De Ejemplo\(\PageIndex{4}\), sabemos\(\mu \approx 46.24\) y\(\sigma \approx 22.18\). Para\(x = 131\),

    \(\dfrac{x-\mu}{\sigma}=\dfrac{131-46.24}{22.18} \approx 3.82\)

    Dado que este valor es más de 2, entonces es inusual tener 131 tornados fuertes o violentos (F3+) en un año.

    b. Variable:\(x =\) número de tornados fuertes o violentos (F3+) Para esta pregunta\(x = 15\),

    \(\dfrac{x-\mu}{\sigma}=\dfrac{15-46.24}{22.18} \approx-1.41\)

    Dado que este valor está entre -2 y 2, entonces no es raro tener solo 15 tornados fuertes o violentos (F3+) en un año.

    Tarea

    Ejercicio\(\PageIndex{1}\)

    1. Los niveles de colesterol se recolectaron de los pacientes dos días después de sufrir un ataque al corazón (Ryan, Joiner & Ryan, Jr, 1985) y están en Ejemplo\(\PageIndex{8}\). Encuentre la media, mediana, rango, varianza y desviación estándar usando tecnología.
      270 236 210 142 280 272 160
      220 226 242 186 266 206 318
      294 282 234 224 276 282 360
      310 280 278 288 288 244 236
      Tabla\(\PageIndex{8}\): Niveles de colesterol
    2. Las longitudes (en kilómetros) de los ríos de la Isla Sur de Nueva Zelanda que fluyen hacia el Océano Pacífico se enumeran en Example\(\PageIndex{9}\) (Lee, 1994).
      Tabla\(\PageIndex{9}\): Longitudes de ríos (km) que fluyen hacia el Océano Pacífico
      Río Longitud (km) Río Longitud (km)
      Clarence 209 Clutha 322
      Conway 48 Taieri 288
      Waiau 169 Shag 72
      Hurunui 138 Kakanui 64
      Waipara 64 Waitaki 209
      Ashley 97 Waihao 64
      Waimakariri 161 Pareora 56
      Selwyn 95 Rangitata 121
      Rakaia 145 Ohi 80
      Ashburton 90

      a. Encuentra la media y la mediana.
      b. Encuentra la gama.
      c. Encuentra la varianza y desviación estándar.

    3. Las longitudes (en kilómetros) de los ríos de la Isla Sur de Nueva Zelanda que fluyen hacia el Océano Pacífico se enumeran en Example\(\PageIndex{9}\) (Lee, 1994).
      Río Longitud (km) Río Longitud (km)
      Hollyford 76 Waimea 48
      Cascade 64 Motueka 108
      Arawhata 68 Takaka 72
      Haast 64 Aorere 72
      Karangarua 37 Heaphy 35
      Cocinero 32 Karamea 80
      Waiho 32 Mokihinui 56
      Whataroa 51 Buller 177
      Wanganui 56 Gris 121
      Waitaha 40 Taramakau 80
      Hokitika 64 Arahura 56

      Cuadro\(\PageIndex{10}\): Longitudes de ríos (km) que fluyen al mar de Tasmania
      a. Encuentra la media y mediana.
      b. Encuentra la gama.
      c. Encuentra la varianza y desviación estándar.

    4. Eyeglassmatic fabrica anteojos para sus minoristas. Prueban para ver cuántas lentes defectuosas hicieron el periodo de tiempo del 1 de enero al 31 de marzo. Ejemplo\(\PageIndex{11}\) da el defecto y el número de defectos.
      Tipo de defecto Número de defectos
      Rasguño 5865
      Forma derecha - pequeña 4613
      Descamado 1992
      Eje incorrecto 1838
      El chaflán está mal 1596
      agrietamiento, grietas 1546
      Forma incorrecta 1485
      PD incorrecto 1398
      Manchas y burbujas 1371
      Altura incorrecta 1130
      Forma derecha - grande 1105
      Perdido en laboratorio 976
      Manchas/Burbuja - pasante 976

      Cuadro\(\PageIndex{11}\): Número de lentes defectuosos
      a. Encuentra la media y mediana.
      b. Encuentra la gama.
      c. Encuentra la varianza y desviación estándar.
    5. Los empleados de la empresa de impresión Print-O-Matic tienen salarios que están contenidos en Ejemplo\(\PageIndex{12}\). Encuentre la media, mediana, rango, varianza y desviación estándar usando tecnología.
      Empleado Sueldo ($) Empleado Sueldo ($)
      CEO 272,500 Administración 66,346
      Conductor 58,456 Ventas 109,739
      CD74 100,702 Diseñador 90,090
      CD65 57,380 Platinas 69,573
      Embellecedor 73,877 Polar 75,526
      Carpeta 65,270 ITEK 64,553
      GTO 74,235 Mgmt 108,448
      Gerente de Pre Prensa 108,448 Trabajo hecho a mano 52,718
      Gerente de Pre Prensa/IT 98.837 Horizon 76,029
      Pre Prensa/Artista Gráfico 75,311
      Tabla\(\PageIndex{12}\): Salarios de los empleados de Print-O-Matic Printing Company
    6. Imprint-O-Matic empresa de impresión gasta montos específicos en costos fijos cada mes. Los costos de esos costos fijos están en Ejemplo\(\PageIndex{13}\).
      Tabla\(\PageIndex{13}\): Costos fijos para Imprint-O-Matic Printing Company
      Cargos mensuales Costo mensual ($)
      Cargos bancarios 482
      Limpieza 2208
      Computadora cara 2471
      Pagos de arrendamiento 2656
      Franqueo 2117
      Uniformes 2600

      a. Encuentra la media y la mediana.
      b. Encuentra la gama.
      c. Encuentra la varianza y desviación estándar.

    7. Comparar los dos conjuntos de datos en los problemas 2 y 3 usando la media y la desviación estándar. Discutir cuál es la media más alta y cuál tiene una mayor dispersión de los datos.
    8. Ejemplo\(\PageIndex{14}\) contiene las frecuencias de pulso recolectadas de machos, que son no fumadores pero sí beben alcohol (“Pulso antes”, 2013). La frecuencia del pulso anterior es antes de que ejercitaran, y la frecuencia del pulso posterior se tomó después de que el sujeto corriera en su lugar durante un minuto. Compare los dos conjuntos de datos usando la media y la desviación estándar. Discutir cuál es la media más alta y cuál tiene una mayor dispersión de los datos.
      Pulso antes Pulso después Pulso antes Pulso después
      76 88 59 92
      56 110 60 104
      64 126 65 82
      50 90 76 150
      49 83 145 155
      68 136 84 140
      68 125 78 141
      88 150 85 131
      80 146 78 132
      78 168
      Tabla\(\PageIndex{14}\): Pulso de varones antes y después del ejercicio
    9. Ejemplo\(\PageIndex{15}\) contiene las frecuencias de pulso recolectadas de hembras, que son no fumadoras pero sí beben alcohol (“Pulso antes”, 2013). La frecuencia del pulso anterior es antes de que ejercitaran, y la frecuencia del pulso posterior se tomó después de que el sujeto corriera en su lugar durante un minuto. Compare los dos conjuntos de datos usando la media y la desviación estándar. Discutir cuál es la media más alta y cuál tiene una mayor dispersión de los datos.
      Pulso antes Pulso después Pulso antes Pulso después
      96 176 92 120
      82 150 70 96
      86 150 75 130
      72 115 70 119
      78 129 70 95
      90 160 68 84
      88 120 47 136
      71 125 64 120
      66 89 70 98
      76 132 74 168
      70 120 85 130
      Tabla\(\PageIndex{15}\): Pulso de las hembras antes y después del ejercicio
    10. Para determinar si el Reiki es un método efectivo para tratar el dolor, se realizó un estudio piloto donde un terapeuta de Reiki certificado de segundo grado brindó tratamiento a voluntarios. El dolor se midió usando una escala visual analógica (VAS) inmediatamente antes y después del tratamiento de Reiki (Olson & Hanson, 1997) y los datos están en Ejemplo\(\PageIndex{16}\). Compare los dos conjuntos de datos usando la media y la desviación estándar. Discutir cuál es la media más alta y cuál tiene una mayor dispersión de los datos.
      VAS antes VAS después VAS antes VAS después
      6 3 5 1
      2 1 1 0
      2 0 6 4
      9 1 6 1
      3 0 4 4
      3 2 4 1
      4 1 7 6
      5 2 2 1
      2 2 4 3
      3 0 8 8
      Tabla\(\PageIndex{16}\): Medidas del dolor antes y después del tratamiento de Reiki
    11. Ejemplo\(\PageIndex{17}\) contiene datos recopilados sobre el tiempo que toma en segundos de cada paso de juego en una partida de rugby. (“Tiempo de los pasajes”, 2013)
      Tabla\(\PageIndex{17}\): Tiempos (en segundos) de jugadas de rugby
      39.2 2.7 9.2 14.6 1.9 17.8 15.5 53.8 17.5 27.5
      4.8 8.6 22.1 29.8 10.4 9.8 27.7 32.7 32 34.3
      29.1 6.5 2.8 10.8 9.2 12.9 7.1 23.8 7.6 36.4
      35.6 28.4 37.2 16.8 21.2 14.7 44.5 24.7 36.2 20.9
      19.9 24.4 7.9 2.8 2.7 3.9 14.1 28.4 45.5 38
      18.5 8.3 56.2 10.2 5.5 2.5 46.8 23.1 9.2 10.3
      10.2 22 28.5 24 17.3 12.7 15.5 4 5.6 3.8
      21.6 49.3 52.4 50.1 30.5 37.2 15 38.7 3.1 11
      10 5 48.8 3.6 12.6 9.9 58.6 37.9 19.4 29.2
      12.3 39.2 22.2 39.7 6.4 2.5 34

      a. Utilizando la tecnología, encontrar la media y la desviación estándar.
      b. Usa el teorema de Chebyshev para encontrar un intervalo centrado en los tiempos medios de cada paso de juego en el juego de rugby en el que esperarías que caigan al menos 75% de los tiempos.
      c. Usa el teorema de Chebyshev para encontrar un intervalo centrado en los tiempos medios de cada paso de juego en el juego de rugby en el que esperarías que caigan al menos 88.9% de los tiempos.

    12. Las cantidades anuales de lluvia (en milímetros) en Sydney, Australia, se encuentran en la tabla #3 .2.18 (“Máximo anual de,” 2013).
      Tabla\(\PageIndex{18}\): Cantidades anuales de lluvia en Sydney, Australia
      146.8 383 90.9 178.1 267.5 95.5 156.5 180
      90.9 139.7 200.2 171.7 187.2 184.9 70.1 58
      84.1 55.6 133.1 271.8 135.9 71.9 99.4 110.6
      47.5 97.8 122.7 58.4 154.4 173.7 118.8 88
      84.6 171.5 254.3 185.9 137.2 138.9 96.2 85
      45.2 74.7 264.9 113.8 133.4 68.1 156.4

      a. Utilizando la tecnología, encontrar la media y la desviación estándar.
      b. use el teorema de Chebyshev para encontrar un intervalo centrado en las cantidades medias anuales de lluvia en Sydney, Australia, en el que se esperaría que al menos el 75% de las cantidades cayeran.
      c. Usa el teorema de Chebyshev para encontrar un intervalo centrado en las cantidades medias anuales de lluvia en Sydney, Australia, en el que esperarías que caigan al menos 88.9% de las cantidades.

    13. El número de muertes atribuidas a la radiación UV en los países africanos en el año 2002 se da en Ejemplo\(\PageIndex{19}\) (“Radiación UV: Burden”, 2013).
      Tabla\(\PageIndex{19}\): Número de muertes por radiación UV
      50 84 31 338 6 504 40 7 58
      204 15 27 39 1 45 174 98 94
      199 9 27 58 356 5 45 5 94
      26 171 13 57 138 39 3 171 41
      1177 102 123 433 35 40 456 125

      a. Utilizando la tecnología, encontrar la media y la desviación estándar.
      b. use el teorema de Chebyshev para encontrar un intervalo centrado en el número medio de muertes por radiación UV en el que se esperaría que al menos 75% de los números cayeran.
      c. Usa el teorema de Chebyshev para encontrar un intervalo centrado en el número medio de muertes por radiación UV en el que se esperaría que al menos el 88.9% de los números cayeran.

    14. El tiempo (en 1/50 segundos) entre pulsos sucesivos a lo largo de una fibra nerviosa (“Tiempo entre nervio”, 2013) se dan en Ejemplo\(\PageIndex{20}\).
      Tabla\(\PageIndex{20}\): Tiempo (en 1/50 segundos) entre pulsos sucesivos
      10.5 1.5 2.5 5.5 29.5 3 9 27.5 18.5 4.5
      7 9.5 1 7 4.5 2.5 7.5 11.5 7.5 4
      12 8 3 5.5 7.5 4.5 1.5 10.5 1 7
      12 14.5 8 3.5 3.5 2 1 7.5 6 13
      7.5 16.5 3 25.5 5.5 14 18 7 27.5 14

      a. Utilizando la tecnología, encontrar la media y la desviación estándar.
      b. Usa el teorema de Chebyshev para encontrar un intervalo centrado en el tiempo medio entre pulsos sucesivos a lo largo de una fibra nerviosa en el que esperarías que caigan al menos 75% de los tiempos.
      c. Usa el teorema de Chebyshev para encontrar un intervalo centrado en el tiempo medio entre pulsos sucesivos a lo largo de una fibra nerviosa en el que esperarías que caigan al menos 88.9% de los tiempos.

    15. Supongamos que un paso de juego en un juego de rugby toma 75.1 segundos. ¿Sería inusual que esto sucediera? Usa la media y desviación estándar que calculaste en el problema 11.
    16. Supongamos que Sydney, Australia recibió 300 mm de lluvia en un año. ¿Sería esto inusual? Usa la media y desviación estándar que calculaste en el problema 12.
    17. Supongamos que en un año determinado hubo 2257 muertes atribuidas a la radiación UV en un país africano. ¿Este valor es inusual? Usa la media y desviación estándar que calculaste en el problema 13.
    18. Supongamos que solo toma 2 (1/50 segundos) para pulsos sucesivos a lo largo de una fibra nerviosa. ¿Este valor es inusual? Usa la media y desviación estándar que calculaste en el problema 14.
    Contestar

    1. media = 253.93, mediana = 268, rango = 218, varianza = 2276.29, st dev = 47.71

    3. a. media = 67.68 km, mediana = 64 km, b. rango = 145 km, c. varianza = 1107.9416\(\mathrm{km}^{2}\), st dev = 33.29 km

    5. media = $89.370.42, mediana = $75.311, rango = $219.782, varianza =2298639399, st dev = $47,944.13

    7. Ver soluciones

    9. \(\overline{x}_{1} \approx 75.45, s_{1} \approx 11.10, \overline{x}_{2} \approx 125.55, s_{2} \approx 24.72\)

    11. a.\(\overline{x} \approx 21.24 \mathrm{sec}, s \approx 14.95 \mathrm{sec}\) b.\((-8.66 \mathrm{sec}, 51.14 \mathrm{sec})\) c.\((-23.61 \mathrm{sec}, 66.09 \mathrm{sec})\)

    13. a.\(\overline{x} \approx 130.98, s \approx 205.44\) b.\((-279.90,541.86)\) c.\((-485.34,747.3)\)

    15. 3.61

    17. 10.35


    This page titled 3.2: Medidas de propagación is shared under a CC BY-SA 4.0 license and was authored, remixed, and/or curated by Kathryn Kozak via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.