Saltar al contenido principal
Library homepage
 
LibreTexts Español

Unidad 3A: Probabilidad

  • Page ID
    151222
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    CO-1: Describir los roles que la bioestadística desempeña en la disciplina de la salud pública.

    CO-6: Aplicar conceptos básicos de probabilidad, variación aleatoria y distribuciones de probabilidad estadística de uso común.

    Video

    Video: Unidad 3A: Introducción (5:36)

    Reseña del Big Picture

    Objetivos de aprendizaje

    LO 1.3: Identificar y diferenciar entre los componentes del Panorama General de la Estadística

    Recordemos el panorama general, el proceso de cuatro pasos que abarca la estadística (tal y como se presenta en este curso):

    El panorama general de la estadística. Primero, se creó un conjunto de datos a partir de un subconjunto de la población. Este es el paso Producir datos. Luego, realizamos análisis exploratorios de datos sobre los datos. Con estos resultados, aplicamos probabilidad que es nuestro primer paso para sacar conclusiones sobre la población a partir de los datos. Después de haber aplicado probabilidad a los datos, podemos sacar conclusiones. Esto se llama inferencia, el segundo paso para sacar conclusiones. En esta unidad estaremos viendo el paso Probabilidad.

    Hasta el momento, hemos discutido los dos primeros pasos:

    Producir datos: cómo se obtienen los datos y qué consideraciones afectan el proceso de producción de datos.

    Análisis exploratorio de datos: herramientas que nos ayudan a tener una primera idea de los datos, al exponer sus características mediante pantallas visuales y resúmenes numéricos que nos ayudan a explorar distribuciones, comparar distribuciones e investigar relaciones.

    (Recordemos que la estructura de este curso es tal que primero se cubrió Análisis Exploratorio de Datos, seguido de Producción de Datos.)

    Nuestro objetivo final es la inferencia: sacar conclusiones confiables sobre la población a partir de lo que hemos descubierto en nuestra muestra.

    Sin embargo, para entender realmente cómo funciona la inferencia, primero necesitamos hablar de Probabilidad, porque es la base subyacente de los métodos de inferencia estadística.

    La unidad de probabilidad comienza con una introducción, que te dará algunos ejemplos motivadores y una perspectiva intuitiva e informal sobre la probabilidad.

    ¿Por qué necesitamos entender la probabilidad?

    • A menudo queremos estimar la posibilidad de que ocurra un evento (de interés para nosotros).
    • Muchos valores de interés son probabilidades o se derivan de probabilidades, por ejemplo, tasas de prevalencia, tasas de incidencia y sensibilidad/especificidad de las pruebas de enfermedad.
    • Además!! La estadística inferencial se basa en la probabilidad de
      • Hipótesis de prueba
      • Estimar valores poblacionales, como la media poblacional o la proporción poblacional.

    Probabilidad e inferencia

    Usaremos un ejemplo para tratar de explicar por qué la probabilidad es tan esencial para la inferencia.

    Primero, aquí está la idea general:

    Como todos sabemos, la forma en que funciona la estadística es que utilizamos una muestra para conocer la población de la que se extrajo. Idealmente, la muestra debe ser aleatoria para que represente bien a la población.

    Recordemos de la discusión sobre el muestreo que cuando decimos que una muestra aleatoria representa bien a la población nos referimos a que no hay sesgo inherente en esta técnica de muestreo.

    Sin embargo, es importante reconocer que esto no significa que todas las muestras aleatorias sean necesariamente “perfectas”. Las muestras aleatorias siguen siendo aleatorias, y por lo tanto ninguna muestra aleatoria será exactamente la misma que otra.

    Una muestra aleatoria puede dar una representación bastante precisa de la población, mientras que otra muestra aleatoria podría estar “apagada”, puramente por casualidad.

    Desafortunadamente, al mirar una muestra en particular (que es lo que sucede en la práctica), nunca sabremos en qué medida difiere de la población.

    Esta incertidumbre es donde la probabilidad entra en el cuadro. Esto nos da una manera de sacar conclusiones sobre la población ante la incertidumbre que se genera por el uso de una muestra aleatoria.

    Usamos la probabilidad para cuantificar cuánto esperamos que varíen las muestras aleatorias.

    El siguiente ejemplo ilustrará este importante punto.

    EJEMPLO:

    Supongamos que nos interesa estimar el porcentaje de adultos estadunidenses que favorecen la pena de muerte.

    Para ello, elegimos una muestra aleatoria de 1,200 adultos estadounidenses y pedimos su opinión: ya sea a favor o en contra de la pena de muerte.

    Encontramos que 744 de los mil 200, o 62%, están a favor. (Comentario: aunque esto es sólo un ejemplo, esta cifra del 62% es bastante realista, dadas algunas encuestas recientes).

    Aquí hay una imagen que ilustra lo que hemos hecho y encontrado en nuestro ejemplo:

    Tenemos un gran círculo que representa a toda la población de adultos estadounidenses. Nos interesan las opiniones de la población sobre la pena de muerte. De esta población sacamos una muestra aleatoria de 1200 adultos, y encontramos que dentro de esta muestra, 62% están a favor de la pena de muerte.

    Nuestro objetivo aquí es la inferencia — conocer y sacar conclusiones sobre las opiniones de toda la población de adultos estadunidenses respecto a la pena de muerte, con base en las opiniones de solo 1,200 de ellos.

    ¿Podemos concluir que 62% de la población favorece la pena de muerte?

    • Otra muestra aleatoria podría dar un resultado muy diferente. Entonces estamos inciertos.

    Pero como nuestra muestra es aleatoria, sabemos que nuestra incertidumbre se debe al azar, y no por problemas con la forma en que se recolectó la muestra.

    Así podemos usar la probabilidad para describir la probabilidad de que nuestra muestra esté dentro de un nivel deseado de precisión.

    Por ejemplo, la probabilidad puede responder a la pregunta: “¿Qué tan probable es que nuestra estimación muestral no sea superior al 3% del verdadero porcentaje de todos los adultos estadounidenses que están a favor de la pena de muerte?”

    La respuesta a esta pregunta (que encontramos usando probabilidad) obviamente va a tener un impacto importante en la confianza que podemos adjuntar al paso de inferencia.

    En particular, si nos parece bastante improbable que el porcentaje muestral sea muy diferente del porcentaje poblacional, entonces tenemos mucha confianza en que podemos sacar conclusiones sobre la población con base en la muestra.

    En las ciencias de la salud, una situación comparable al ejemplo de la pena de muerte sería cuando se desea determinar la prevalencia de una determinada enfermedad o condición.

    En epidemiología, la prevalencia de un estado relacionado con la salud (típicamente enfermedad, pero también otras cosas como el tabaquismo o el uso del cinturón de seguridad) en una población estadística se define como el número total de casos en la población, dividido por el número de individuos en la población.

    Como veremos, esta es una forma de probabilidad.

    En la práctica, necesitaremos estimar la prevalencia utilizando una muestra y para hacer inferencias sobre la población a partir de una muestra, necesitaremos comprender la probabilidad.

    EJEMPLO:

    El CDC estima que en 2011, 8.3% de la población estadounidense tiene diabetes. En otras palabras, los CDC estiman que la prevalencia de diabetes es de 8.3% en Estados Unidos.

    Hoja Informativa sobre Diabetes de los CDC.

    Hay numerosas estadísticas y gráficas reportadas en este documento que ahora debes entender!!

    Otras probabilidades comunes utilizadas en las ciencias de la salud son

    • (Acumulada) Incidencia: la probabilidad de que una persona sin enfermedad previa desarrolle la enfermedad durante algún periodo de tiempo especificado
    • Sensibilidad de una prueba diagnóstica o de tamizaje: la probabilidad de que la persona dé positivo, dado que la persona tiene la enfermedad. Especificidad de una prueba diagnóstica o de tamizaje: la probabilidad de que la persona dé negativo, dado que la persona no tiene la enfermedad. Así como valor predictivo positivo, valor predictivo negativo, tasa de falsos positivos, tasa de falsos negativos.
    • Probabilidad de supervivencia: la probabilidad de que un individuo sobreviva más allá de cierto tiempo


    Unidad 3A: Probabilidad is shared under a CC BY-NC-SA 4.0 license and was authored, remixed, and/or curated by LibreTexts.