Saltar al contenido principal
LibreTexts Español

4.5: Análisis estadístico de datos

  • Page ID
    75525
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Un intervalo de confianza es una manera útil de reportar el resultado de un análisis porque establece límites sobre el resultado esperado. En ausencia de un error determinado, un intervalo de confianza basado en la media de una muestra indica el rango de valores en el que esperamos encontrar la media de la población. Cuando reportamos un intervalo de confianza del 95% para la masa de un centavo como 3.117 g ± 0.047 g, por ejemplo, estamos afirmando que solo hay un 5% de probabilidad de que la masa esperada del centavo sea inferior a 3.070 g o superior a 3.164 g.

    Debido a que un intervalo de confianza es una declaración de probabilidad, nos permite considerar preguntas comparativas, como estas: “¿Los resultados de un método recién desarrollado para determinar el colesterol en sangre son significativamente diferentes de los obtenidos mediante un método estándar?” o “¿Existe una variación significativa en la composición del agua de lluvia recolectada en diferentes sitios a favor del viento de una planta de servicios públicos que quema carbón?” En esta sección se introduce una aproximación general al análisis estadístico de los datos. Las pruebas estadísticas específicas se presentan en la Sección 4.6.

    La confiabilidad de las pruebas de significancia recientemente ha recibido mucha atención —véase Nuzzo, R. “Método científico: errores estadísticos”, Nature, 2014, 506, 150—152 para una discusión general de los temas— por lo que es apropiado comenzar esta sección señalando la necesidad de asegurar que nuestros datos y nuestra pregunta de investigación son compatibles para que no leamos más en un análisis estadístico de lo que nuestros datos permiten; ver Leek, J. T.; Peng, R. D. “¿Cuál es la Pregunta? Science, 2015, 347, 1314-1315 para una discusión de uso de seis preguntas comunes de investigación.

    En el contexto de la química analítica, las pruebas de significancia suelen acompañar a un análisis exploratorio de datos (¿hay alguna razón para sospechar que existe una diferencia entre estos dos métodos analíticos cuando se aplican a una muestra común?) o un análisis de datos inferenciales (¿Hay alguna razón para sospechar que existe una relación entre estas dos mediciones independientes?). Un resultado estadísticamente significativo para este tipo de preguntas de investigación analítica generalmente conduce al diseño de experimentos adicionales más adecuados para hacer predicciones o explicar una relación causal subyacente. Una prueba de significancia es el primer paso para construir una mayor comprensión de un problema analítico, no la respuesta final a ese problema.

    Pruebas de significancia

    Consideremos el siguiente problema. Para determinar si un medicamento es efectivo para disminuir las concentraciones de glucosa en sangre, recolectamos dos conjuntos de muestras de sangre de un paciente. Recolectamos un conjunto de muestras inmediatamente antes de administrar el medicamento, y recolectamos el segundo conjunto de muestras varias horas después. Después de analizar las muestras, reportamos sus respectivas medias y varianzas. ¿Cómo decidimos si el medicamento logró disminuir la concentración de glucosa en sangre del paciente?

    Una forma de responder a esta pregunta es construir una curva de distribución normal para cada muestra y comparar las dos curvas entre sí. Tres posibles resultados se muestran en la Figura 4.5.1 . En la Figura 4.5.1 a, hay una separación completa de las dos curvas de distribución normal, lo que sugiere que las dos muestras son significativamente diferentes entre sí. En la Figura 4.5.1 b, las curvas de distribución normal para las dos muestras se superponen casi por completo, lo que sugiere que la diferencia entre las muestras es insignificante. La figura 4.5.1 c, sin embargo, nos presenta un dilema. Aunque las medias para las dos muestras parecen diferentes, el solapamiento de sus curvas de distribución normal sugiere que un número significativo de posibles resultados podrían pertenecer a cualquiera de las dos distribuciones. En este caso lo mejor que podemos hacer es hacer una declaración sobre la probabilidad de que las muestras sean significativamente diferentes entre sí.

    Figura 4.5.1 : Tres ejemplos de las posibles relaciones entre las curvas de distribución normal para dos muestras. En (a) las curvas no se superponen, lo que sugiere que las muestras son significativamente diferentes entre sí. En (b) las dos curvas son casi idénticas, lo que sugiere que las muestras son indistinguibles. El solapamiento parcial de las curvas en (c) significa que lo mejor que podemos hacer es evaluar la probabilidad de que haya una diferencia entre las muestras.

    El proceso mediante el cual determinamos la probabilidad de que haya una diferencia significativa entre dos muestras se denomina prueba de significancia o prueba de hipótesis. Antes de discutir ejemplos específicos, primero estableceremos un enfoque general para realizar e interpretar una prueba de significancia.

    Construyendo una prueba de significancia

    El propósito de una prueba de significancia es determinar si la diferencia entre dos o más resultados es suficientemente grande como para que no pueda explicarse por errores indeterminados. El primer paso para construir una prueba de significancia es plantear el problema como una pregunta de sí o no, como “¿Este medicamento es efectivo para bajar los niveles de glucosa en sangre de un paciente?” Una hipótesis nula y una hipótesis alternativa definen las dos posibles respuestas a nuestra pregunta de sí o no. La hipótesis nula, H 0, es que los errores indeterminados son suficientes para explicar cualquier diferencia entre nuestros resultados. La hipótesis alternativa, H A, es que las diferencias en nuestros resultados son demasiado grandes para ser explicadas por error aleatorio y que deben ser determinadas en la naturaleza. Probamos la hipótesis nula, que o bien retenemos o rechazamos. Si rechazamos la hipótesis nula, entonces debemos aceptar la hipótesis alternativa y concluir que la diferencia es significativa.

    No rechazar una hipótesis nula no es lo mismo que aceptarla. Conservamos una hipótesis nula porque no tenemos pruebas suficientes para demostrarla incorrecta. Es imposible probar que una hipótesis nula es cierta. Este es un punto importante y fácil de olvidar. Para apreciar este punto volvamos a nuestra muestra de 100 peniques en la Tabla 4.4.3. Después de mirar los datos podríamos proponer las siguientes hipótesis nulas y alternativas.

    H 0: La masa de un centavo estadounidense circulante está entre 2.900 g y 3.200 g

    H A: La masa de un centavo circulante estadounidense puede ser inferior a 2.900 g o superior a 3.200 g

    Para probar la hipótesis nula encontramos un centavo y determinamos su masa. Si la masa del centavo es de 2.512 g entonces podemos rechazar la hipótesis nula y aceptar la hipótesis alternativa. Supongamos que la masa del centavo es de 3.162 g. Aunque este resultado aumenta nuestra confianza en la hipótesis nula, no prueba que la hipótesis nula sea correcta porque el siguiente centavo que muestremos podría pesar menos de 2.900 g o más de 3.200 g.

    Después de exponer las hipótesis nulas y alternativas, el segundo paso es elegir un nivel de confianza para el análisis. El nivel de confianza define la probabilidad de que rechacemos la hipótesis nula cuando es, de hecho, cierta. Podemos expresar esto como nuestra confianza en que tenemos razón al rechazar la hipótesis nula (e.g. 95%), o como la probabilidad de que seamos incorrectos al rechazar la hipótesis nula. Para este último, el nivel de confianza se da como\(\alpha\), donde

    \[\alpha = 1 - \frac {\text{confidence interval (%)}} {100} \label{4.1}\]

    Para un nivel de confianza del 95%,\(\alpha\) es 0.05.

    En este libro de texto usamos\(\alpha\) para representar la probabilidad de que rechacemos incorrectamente la hipótesis nula. En otros libros de texto esta probabilidad se da como p (a menudo se lee como “p- valor”). Aunque los símbolos difieren, el significado es el mismo.

    El tercer paso es calcular un estadístico de prueba apropiado y compararlo con un valor crítico. El valor crítico del estadístico de prueba define un punto de interrupción entre valores que nos llevan a rechazar o retener la hipótesis nula, que es el cuarto y último paso de una prueba de significancia. La forma en que calculemos el estadístico de prueba depende de lo que estemos comparando, tema que cubrimos en la Sección 4.6. El último paso es o bien retener la hipótesis nula, o rechazarla y aceptar la hipótesis alternativa.

    Los cuatro pasos para un análisis estadístico de los datos mediante una prueba de significancia:

    1. Plantar una pregunta, y exponer la hipótesis nula, H 0, y la hipótesis alternativa, H A.
    2. Elija un nivel de confianza para el análisis estadístico.
    3. Calcular un estadístico de prueba apropiado y compararlo con un valor crítico.
    4. O bien conservar la hipótesis nula, o rechazarla y aceptar la hipótesis alternativa.

    Pruebas de significancia de una cola y dos colas

    Supongamos que queremos evaluar la precisión de un nuevo método analítico. Podríamos usar el método para analizar un Material de Referencia Estándar que contenga una concentración conocida de analito,\(\mu\). Analizamos el estándar varias veces, obteniendo un valor medio\(\overline{X}\), para la concentración del analito. Nuestra hipótesis nula es que no hay diferencia entre\(\overline{X}\) y\(\mu\)

    \[H_0 \text{: } \overline{X} = \mu \nonumber\]

    Si realizamos la prueba de significancia en\(\alpha = 0.05\), entonces conservamos la hipótesis nula si un intervalo de confianza del 95% alrededor\(\overline{X}\) contiene\(\mu\). Si la hipótesis alternativa es

    \[H_\text{A} \text{: } \overline{X} \neq \mu \nonumber\]

    entonces rechazamos la hipótesis nula y aceptamos la hipótesis alternativa si\(\mu\) se encuentra en las áreas sombreadas en cualquiera de los extremos de la curva de distribución de probabilidad de la muestra (Figura 4.5.2 a). Cada una de las áreas sombreadas representa 2.5% del área bajo la curva de distribución de probabilidad, para un total de 5%. Esta es una prueba de significancia de dos colas porque rechazamos la hipótesis nula para valores de ambos\(\mu\) extremos de la curva de distribución de probabilidad de la muestra.

    En la gráfica “a”, ambos extremos de la distribución se incluyen en la prueba, pero en “b” y “c” solo se incluyen las colas izquierda y derecha respectivamente.
    Figura 4.5.2 : Ejemplos de (a) prueba de significancia de dos colas y (b, c) de una cola de\(\overline{X}\) y\(\mu\). Las curvas de distribución de probabilidad, que son distribuciones normales, se basan en la media y desviación estándar de la muestra. Para\(\alpha\) = 0.05, las áreas azules representan el 5% del área bajo la curva. Si el valor de\(\mu\) cae dentro de las áreas azules, entonces rechazamos la hipótesis nula y aceptamos la hipótesis alternativa. Conservamos la hipótesis nula si el valor de\(\mu\) cae dentro del área no sombreada de la curva.

    También podemos escribir la hipótesis alternativa de dos maneras adicionales

    \[H_\text{A} \text{: } \overline{X} > \mu \nonumber\]

    \[H_\text{A} \text{: } \overline{X} < \mu \nonumber\]

    rechazando la hipótesis nula si n cae dentro de las áreas sombreadas que se muestran en la Figura 4.5.2 b o la Figura 4.5.2 c, respectivamente. En cada caso el área sombreada representa el 5% del área bajo la curva de distribución de probabilidad. Estos son ejemplos de una prueba de significancia de una cola.

    Para un nivel de confianza fijo, una prueba de significancia de dos colas es la prueba más conservadora porque rechazar la hipótesis nula requiere una mayor diferencia entre los parámetros que estamos comparando. En la mayoría de las situaciones no tenemos ninguna razón particular para esperar que un parámetro debe ser mayor (o debe ser menor) que el otro parámetro. Este es el caso, por ejemplo, cuando evaluamos la precisión de un nuevo método analítico. Una prueba de significancia de dos colas, por lo tanto, suele ser la elección adecuada.

    Reservamos una prueba de significancia de una cola para una situación en la que específicamente estamos interesados en saber si un parámetro es mayor (o menor) que el otro parámetro. Por ejemplo, una prueba de significancia de una cola es apropiada si estamos evaluando la capacidad de un medicamento para disminuir los niveles de glucosa en sangre. En este caso solo nos interesa si los niveles de glucosa después de administrar el medicamento son menores que los niveles de glucosa antes de iniciar el tratamiento. Si el nivel de glucosa en sangre de un paciente es mayor después de administrar el medicamento, entonces conocemos la respuesta —la medicación no funcionó— y no necesitamos realizar un análisis estadístico.

    Error en las pruebas de significancia

    Debido a que una prueba de significancia se basa en la probabilidad, su interpretación está sujeta a error. En una prueba de significancia, a define la probabilidad de rechazar una hipótesis nula que es verdadera. Cuando realizamos una prueba de significancia en\(\alpha = 0.05\), hay un 5% de probabilidad de que rechacemos incorrectamente la hipótesis nula. Esto se conoce como error tipo 1, y su riesgo siempre es equivalente a\(\alpha\). Un error tipo 1 en una prueba de significancia de dos colas o de una cola corresponde a las áreas sombreadas bajo las curvas de distribución de probabilidad en la Figura 4.5.2 .

    Un segundo tipo de error ocurre cuando conservamos una hipótesis nula aunque sea falsa. Esto es como un error tipo 2, y la probabilidad de que ocurra es\(\beta\). Desafortunadamente, en la mayoría de los casos no podemos calcular ni estimar el valor para\(\beta\). La probabilidad de un error tipo 2, sin embargo, es inversamente proporcional a la probabilidad de un error tipo 1.

    Minimizar un error de tipo 1 al disminuir\(\alpha\) aumenta la probabilidad de un error de tipo 2. Cuando elegimos un valor para\(\alpha\) debemos comprometernos entre estos dos tipos de error. La mayoría de los ejemplos de este texto utilizan un nivel de confianza del 95% (\(\alpha = 0.05\)) porque esto suele ser un compromiso razonable entre los errores tipo 1 y tipo 2 para el trabajo analítico. No es inusual, sin embargo, utilizar un nivel de confianza más estricto (por ejemplo\(\alpha = 0.01\)) o más indulgente (por ejemplo\(\alpha = 0.10\)) cuando la situación lo requiere.


    This page titled 4.5: Análisis estadístico de datos is shared under a CC BY-NC-SA license and was authored, remixed, and/or curated by David Harvey.