Saltar al contenido principal
LibreTexts Español

4.1: Caracterización de mediciones y resultados

  • Page ID
    75526
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Empecemos por elegir un problema cuantitativo sencillo que requiera una sola medición: ¿Cuál es la masa de un centavo? Probablemente reconozcas que nuestra afirmación del problema es demasiado amplia. Por ejemplo, ¿nos interesa la masa de un centavo de Estados Unidos o de un centavo canadiense, o es relevante la diferencia? Debido a que la composición y el tamaño de un centavo pueden diferir de un país a otro, limitemos nuestro problema a centavos de Estados Unidos.

    Hay otras preocupaciones que podríamos considerar. Por ejemplo, la Casa de la Moneda de los Estados Unidos produce centavos en dos ubicaciones (Figura 4.1.1 ). Debido a que parece poco probable que la masa de un centavo dependa de dónde se acuñe, ignoraremos esta preocupación. Otra preocupación es si la masa de un centavo recién acuñado es diferente de la masa de un centavo circulante. Porque la respuesta esta vez no es obvia, vamos a estrechar aún más nuestra pregunta y preguntarnos “¿Cuál es la masa de un Penny circulante de Estados Unidos?”

    Figura 4.1.1 : Un centavo de cabeza Lincoln de 2005 sin circular. La “D” por debajo de la fecha indica que este centavo se produjo en la Casa de la Moneda de los Estados Unidos en Denver, Colorado. Los centavos producidos en la Casa de la Moneda de Filadelfia no tienen una letra debajo de la fecha. Fuente: United States Mint imagen.

    Una buena manera de comenzar nuestro análisis es recabar algunos datos preliminares. La Tabla 4.1.1 muestra las masas por siete centavos recogidos de mi frasco de cambio. Al examinar estos datos vemos que nuestra pregunta no tiene una respuesta simple. Es decir, no podemos usar la masa de un solo centavo para sacar una conclusión específica sobre la masa de cualquier otro centavo (aunque podríamos concluir razonablemente que todos los centavos pesan al menos 3 g). Sin embargo, podemos caracterizar estos datos reportando la dispersión de las mediciones individuales alrededor de un valor central.

    Tabla 4.1.1 : Misas de siete centavos circulantes de Estados Unidos
    Penny Masa (g)
    1 3.080
    2 3.094
    3 3.107
    4 3.056
    5 3.112
    6 3.174
    7 3.198

    Medidas de Tendencia Central

    Una forma de caracterizar los datos en la Tabla 4.1.1 es asumir que las masas de centavos individuales están dispersas aleatoriamente alrededor de un valor central que es la mejor estimación de la masa esperada o “verdadera” de un centavo. Hay dos formas comunes de estimar la tendencia central: la media y la mediana.

    Media

    La media,\(\overline{X}\), es la media numérica para un conjunto de datos. Calculamos la media dividiendo la suma de los valores individuales por el tamaño del conjunto de datos

    \[\overline{X} = \frac {\sum_{i = 1}^n X_i} {n} \nonumber\]

    donde\(X_i\) es la i-ésima medición, y n es el tamaño del conjunto de datos.

    Ejemplo 4.1.1

    ¿Cuál es la media para los datos en la Tabla 4.1.1 ?

    Solución

    Para calcular la media sumamos los resultados para todas las mediciones

    \[3.080 + 3.094 + 3.107 + 3.056 + 3.112 + 3.174 + 3.198 = 21.821 \text{ g} \nonumber\]

    y dividir por el número de mediciones

    \[\overline{X} = \frac {21.821 \text{ g}} {7} = 3.117 \text{ g} \nonumber\]

    La media es la estimación más común de tendencia central. No es una estimación robusta, sin embargo, porque un solo valor extremo —uno mucho mayor o mucho menor que el resto de los datos— influye fuertemente en el valor de la media [Rousseeuw, P. J. J. Chemom. 1991, 5, 1—20]. Por ejemplo, si registramos por casualidad la masa del tercer centavo como 31.07 g en lugar de 3.107 g, ¡la media cambia de 3.117 g a 7.112 g!

    Una estimación para un parámetro estadístico es robusta si su valor no se ve afectado demasiado por una medición inusualmente grande o inusualmente pequeña.

    Mediana

    La mediana, \(\widetilde{X}\), es el valor medio cuando ordenamos nuestros datos desde el valor más pequeño hasta el mayor. Cuando los datos tienen un número impar de valores, la mediana es el valor medio. Para un número par de valores, la mediana es el promedio de los valores n /2 y (n /2) + 1, donde n es el tamaño del conjunto de datos.

    Cuando n = 5, la mediana es el tercer valor en el conjunto de datos ordenado; para n = 6, la mediana es el promedio del tercer y cuarto miembros del conjunto de datos ordenado.

    Ejemplo 4.1.2

    ¿Cuál es la mediana de los datos en la Tabla 4.1.1 ?

    Solución

    Para determinar la mediana ordenamos las mediciones desde el valor más pequeño hasta el mayor

    \(3.056 \quad 3.080 \quad 3.094 \quad 3.107 \quad 3.112 \quad 3.174 \quad 3.198\)

    Debido a que hay siete mediciones, la mediana es el cuarto valor en los datos ordenados; así, la mediana es de 3.107 g.

    Como se muestra en Ejemplo 4.1.1 y Ejemplo 4.1.2 , la media y la mediana proporcionan estimaciones similares de tendencia central cuando todas las mediciones son comparables en magnitud. La mediana, sin embargo, es una estimación más robusta de tendencia central porque es menos sensible a mediciones con valores extremos. Por ejemplo, si registramos por casualidad la masa del tercer centavo como 31.07 g en lugar de 3.107 g, el valor de la mediana cambia de 3.107 g a 3.112 g.

    Medidas de propagación

    Si la media o la mediana proporciona una estimación de la masa esperada de un centavo, entonces la dispersión de las mediciones individuales sobre la media o mediana proporciona una estimación de la diferencia de masa entre centavos o de la incertidumbre en la medición de la masa con un saldo. Aunque a menudo definimos la propagación en relación con una medida específica de tendencia central, su magnitud es independiente del valor central. Aunque cambiar todas las mediciones en la misma dirección sumando o restando un valor constante cambia la media o mediana, no cambia el spread. Hay tres medidas comunes de propagación: el rango, la desviación estándar y la varianza.

    El problema 13 al final del capítulo te pide que demuestres que esto es cierto.

    Rango

    El rango, w, es la diferencia entre los valores más grandes y más pequeños de un conjunto de datos.

    \[w = X_\text{largest} - X_\text{smallest} \nonumber\]

    El rango proporciona información sobre la variabilidad total en el conjunto de datos, pero no proporciona información sobre la distribución de los valores individuales. El rango para los datos en la Tabla 4.1.1 es

    \[w = 3.198 \text{ g} - 3.056 \text{ g} = 0.142 \text{ g} \nonumber\]

    Desviación estándar

    La desviación estándar, s, describe la dispersión de los valores individuales sobre su media, y se da como

    \[s = \sqrt{\frac {\sum_{i = 1}^{n} (X_i - \overline{X})^{2}} {n - 1}} \label{4.1}\]

    donde\(X_i\) es uno de los n valores individuales en el conjunto de datos, y\(\overline{X}\) es el valor medio del conjunto de datos. Frecuentemente, reportamos la desviación estándar relativa, s r, en lugar de la desviación estándar absoluta.

    \[s_r = \frac {s} {\overline{X}} \nonumber\]

    El porcentaje de desviación estándar relativa,% s r, es\(s_r \times 100\).

    La desviación estándar relativa es importante porque permite una comparación más significativa entre conjuntos de datos cuando las mediciones individuales difieren significativamente en magnitud. Consideremos nuevamente los datos en la Tabla 4.1.1 . Si multiplicamos cada valor por 10, la desviación estándar absoluta también aumentará en 10; la desviación estándar relativa, sin embargo, es la misma.

    Ejemplo 4.1.3

    Reportar la desviación estándar, la desviación estándar relativa y el porcentaje de desviación estándar relativa para los datos en la Tabla 4.1.1 ?

    Solución

    Para calcular la desviación estándar primero calculamos la diferencia entre cada medición y el valor medio del conjunto de datos (3.117), cuadramos las diferencias resultantes y las sumamos juntas para encontrar el numerador de la Ecuación\ ref {4.1}

    \ [\ begin {alinear*}
    (3.080-3.117) ^2 = (-0.037) ^2 = 0.001369\\
    (3.094-3.117) ^2 = (-0.023) ^2 = 0.000529\\
    (3.107-3.117) ^2 = (-0.010) ^2 = 0.000100\\
    (3.056-3.117) ^2 = (-0.061) ^2 = 0.003721\\
    (3.112-3.117) ^2 = (-0.005) ^2 = 0.000025\\
    (3.174-3.117) ^2 = (+0.057) ^2 = 0.003249\\
    (3.198-3.117) ^2 = (+0.081) ^2 =\ subrayado {0.006561}\\
    0.015554
    \ final {alinear*}\]

    Por razones obvias, al numerador de la Ecuación\ ref {4.1} se le llama suma de cuadrados. A continuación, dividimos esta suma de cuadrados por n — 1, donde n es el número de medidas, y tomamos la raíz cuadrada.

    \[s = \sqrt{\frac {0.015554} {7 - 1}} = 0.051 \text{ g} \nonumber\]

    Finalmente, la desviación estándar relativa y el porcentaje de desviación estándar relativa son

    \[s_r = \frac {0.051 \text{ g}} {3.117 \text{ g}} = 0.016 \nonumber\]

    \[\% s_r = (0.016) \times 100 = 1.6 \% \nonumber\]

    Es mucho más fácil determinar la desviación estándar utilizando una calculadora científica con funciones estadísticas incorporadas.

    Muchas calculadoras científicas incluyen dos claves para calcular la desviación estándar. Una clave calcula la desviación estándar para un conjunto de datos de n muestras extraídas de una colección mayor de posibles muestras, que corresponde a la Ecuación\ ref {4.1}. La otra clave calcula la desviación estándar para todas las muestras posibles. A esta última se le conoce como desviación estándar de la población, que cubriremos más adelante en este capítulo. El manual de tu calculadora te ayudará a determinar la clave adecuada para cada una.

    Varianza

    Otra medida común de propagación es la varianza, que es el cuadrado de la desviación estándar. Generalmente reportamos la desviación estándar de un conjunto de datos, en lugar de su varianza, porque el valor medio y la desviación estándar comparten la misma unidad. Como veremos en breve, la varianza es una medida útil del spread porque sus valores son aditivos.

    Ejemplo 4.1.4

    ¿Cuál es la varianza para los datos en la Tabla 4.1.1 ?

    Solución

    La varianza es el cuadrado de la desviación estándar absoluta. Usando la desviación estándar del Ejemplo 4.1.3 da la varianza como

    \[s^2 = (0.051)^2 = 0.0026 \nonumber\]

    Ejercicio 4.1.1

    Los siguientes datos fueron recolectados como parte de un estudio de control de calidad para el análisis de sodio en suero; los resultados son concentraciones de Na + en mmol/L.

    \(140 \quad 143 \quad 141 \quad 137 \quad 132 \quad 157 \quad 143 \quad 149 \quad 118 \quad 145\)

    Informar la media, la mediana, el rango, la desviación estándar y la varianza para estos datos. Estos datos son parte de un conjunto de datos más grande de Andrew, D. F.; Herzberg, A. M. Data: A Collection of Problems for the Student and Research Worker, Springer-Verlag:New York, 1985, pp. 151—155.

    Responder

    Media: Para encontrar la media sumamos las medidas individuales y dividimos por el número de mediciones. La suma de las 10 concentraciones es 1405. Dividiendo la suma por 10, da la media como 140.5, o\(1.40 \times 10^2\) mmol/L.

    Mediana: Para encontrar la mediana organizamos las 10 mediciones desde la concentración más pequeña hasta la concentración más grande; así

    \(118 \quad 132 \quad 137 \quad 140 \quad 141 \quad 143 \quad 143 \quad 145 \quad 149 \quad 157\)

    La mediana para un conjunto de datos con 10 miembros es el promedio de los valores quinto y sexto; así, la mediana es (141 + 143) /2, o 142 mmol/L.

    Rango: El rango es la diferencia entre el valor más grande y el valor más pequeño; así, el rango es 157 — 118 = 39 mmol/L.

    Desviación estándar: Para calcular la desviación estándar primero calculamos la diferencia absoluta entre cada medición y el valor medio (140.5), cuadramos las diferencias resultantes y las sumamos juntas. Las diferencias son

    \(–0.5 \quad 2.5 \quad 0.5 \quad –3.5 \quad –8.5 \quad 16.5 \quad 2.5 \quad 8.5 \quad –22.5 \quad 4.5\)

    y las diferencias al cuadrado son

    \(0.25 \quad 6.25 \quad 0.25 \quad 12.25 \quad 72.25 \quad 272.25 \quad 6.25 \quad 72.25 \quad 506.25 \quad 20.25\)

    La suma total de cuadrados, que es el numerador de la Ecuación\ ref {4.1}, es 968.50. La desviación estándar es

    \[s = \sqrt{\frac {968.50} {10 - 1}} = 10.37 \approx 10.4 \nonumber\]

    Varianza: La varianza es el cuadrado de la desviación estándar, o 108.


    This page titled 4.1: Caracterización de mediciones y resultados is shared under a CC BY-NC-SA license and was authored, remixed, and/or curated by David Harvey.