Saltar al contenido principal
LibreTexts Español

1.2: Distribución de probabilidad

  • Page ID
    149482
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Una vez que hayamos organizado y resumido sus datos de muestra, el siguiente paso es identificar la distribución subyacente de nuestra variable aleatoria. Las probabilidades de cálculo para variables aleatorias continuas se complican por el hecho de que hay un número infinito de valores posibles que nuestra variable aleatoria puede asumir, por lo que la probabilidad de observar un valor particular para una variable aleatoria es cero. Por lo tanto, para encontrar las probabilidades asociadas a una variable aleatoria continua, utilizamos una función de densidad de probabilidad (PDF).

    Un PDF es una ecuación utilizada para encontrar probabilidades para variables aleatorias continuas. El PDF debe cumplir con las siguientes dos reglas:

    1. El área bajo la curva debe ser igual a uno (sobre todos los valores posibles de la variable aleatoria).
    2. Las probabilidades deben ser iguales o mayores que cero para todos los valores posibles de la variable aleatoria.

    El área bajo la curva de la función de densidad de probabilidad en algún intervalo representa la probabilidad de observar esos valores de la variable aleatoria en ese intervalo.

    La distribución normal

    Muchas variables aleatorias continuas tienen una distribución en forma de campana o algo simétrica. Esta es una distribución normal. En otras palabras, la distribución de probabilidad de su histograma de frecuencia relativa sigue una curva normal. La curva es en forma de campana, simétrica alrededor de la media y definida por µ y σ (la media y desviación estándar).

    Kiernan_media015.png

    Figura 9. Una distribución normal.

    Hay curvas normales para cada combinación de µ y σ. La media (µ) desplaza la curva hacia la izquierda o hacia la derecha. La desviación estándar (σ) altera la dispersión de la curva. El primer par de curvas tienen medias diferentes pero la misma desviación estándar. El segundo par de curvas comparten la misma media (µ) pero tienen diferentes desviaciones estándar. La curva rosa tiene una desviación estándar más pequeña. Es más estrecho y más alto, y la probabilidad se extiende sobre un rango menor de valores. La curva azul tiene una desviación estándar mayor. La curva es más plana y las colas son más gruesas. La probabilidad se extiende sobre un rango mayor de valores.

    07_fig05a

    07_fig05b

    Figura 10. Una comparación de curvas normales.

    Propiedades de la curva normal:

    • La media es el centro de esta distribución y el punto más alto.
    • La curva es simétrica con respecto a la media. (El área a la izquierda de la media es igual al área a la derecha de la media.)
    • El área total bajo la curva es igual a uno.
    • A medida que x aumenta y disminuye, la curva va a cero pero nunca toca.
    • El PDF de una curva normal es $$ y=\ frac {1} {\ sqrt {2\ pi}\ sigma} e^ {\ frac {- (x-\ mu) ^2} {2\ sigma^2}} $$
    • Se puede utilizar una curva normal para estimar probabilidades.
    • Se puede utilizar una curva normal para estimar proporciones de una población que tiene ciertos valores de x.

    La distribución normal estándar

    Existen millones de posibles combinaciones de medias y desviaciones estándar para variables aleatorias continuas. Encontrar probabilidades asociadas a estas variables requeriría que integráramos el PDF en el rango de valores que nos interesan. Para evitar esto, podemos confiar en la distribución normal estándar. La distribución normal estándar es una distribución normal especial con un µ = 0 y σ = 1. Podemos usar la puntuación Z para estandarizar cualquier variable aleatoria normal, convirtiendo los valores x en puntuaciones Z, lo que nos permite usar probabilidades de la tabla normal estándar. Entonces, ¿cómo encontramos el área bajo la curva asociada a una puntuación Z?

    Mesa Normal Estándar

    • La tabla normal estándar da probabilidades asociadas con puntuaciones Z específicas.
    • La tabla que utilizamos es acumulativa desde la izquierda.
    • El lado negativo es para todas las puntuaciones Z menores que cero (todos los valores menores que la media).
    • El lado positivo es para todas las puntuaciones Z mayores que cero (todos los valores mayores que la media).
    • No todas las mesas normales estándar funcionan de la misma manera.

    Ejemplo\(\PageIndex{1}\):

    ¿Cuál es el área asociada a la puntuación Z 1.62?

    429.png

    Figura 11. La tabla normal estándar y área asociada para z = 1.62.

    Contestar

    El área es 0.9474.

    Lectura de la Tabla Normal Estándar

    • Lee la columna Z para obtener la primera parte de la puntuación Z (1.6).
    • Lee a lo largo de la fila superior para obtener el segundo decimal en la puntuación Z (0.02).
    • La intersección de esta fila y columna da el área bajo la curva a la izquierda de la puntuación Z.

    Encontrar puntajes Z para un área determinada

    • ¿Y si tenemos un área y queremos encontrar el puntaje Z asociado a esa área?
    • En lugar de Z-score → area, queremos area → Z-score.
    • Podemos usar la tabla normal estándar para encontrar el área en el cuerpo de valores y leer hacia atrás para encontrar la puntuación Z asociada.
    • Usando la tabla, busca las probabilidades para encontrar un área que esté más cerca de la probabilidad que te interese.

    Ejemplo\(\PageIndex{2}\):

    Para encontrar una puntuación Z para la que el área a la derecha sea del 5%:

    Dado que la tabla es acumulativa desde la izquierda, se debe utilizar el complemento del 5%.

    \[1.000 – 0.05 = 0.9500\]

    Image36062.PNG

    Figura 12. El 5% superior del área bajo una curva normal.

    • Encuentra la puntuación Z para el área de 0.9500.
    • Mira las probabilidades y encuentra un valor lo más cercano posible a 0.9500.

    Image36070.PNG

    Figura 13. La tabla normal estándar.

    Contestar

    El puntaje Z para el percentil 95 es de 1.64.

    Área entre dos puntuaciones Z

    Ejemplo\(\PageIndex{3}\):

    Para encontrar puntuaciones Z que limiten el 95% medio:

    Image36080.PNG

    Figura 14. El 95% medio del área bajo una curva normal.

    Soluciones

    • El 95% medio tiene 2.5% a la derecha y 2.5% a la izquierda.
    • Usa la simetría de la curva.
    • Mira tu mesa normal estándar. Dado que la tabla es acumulativa desde la izquierda, es más fácil encontrar primero el área a la izquierda.
    • Encuentra el área de 0.025 en el lado negativo de la mesa.
    • El puntaje Z para el área a la izquierda es de -1.96.
    • Dado que la curva es simétrica, la puntuación Z para el área a la derecha es de 1.96.

    Puntajes Z comunes

    Hay muchos puntajes Z de uso común:

    • \(Z_{.05}\)= 1.645 y el área entre -1.645 y 1.645 es 90%
    • \(Z_{.025}\)= 1.96 y el área entre -1.96 y 1.96 es 95%
    • \(Z_{.005}\)= 2.575 y el área entre -2.575 y 2.575 es 99%

    Aplicaciones de la Distribución Normal

    Normalmente, nuestros datos normalmente distribuidos no tienen μ = 0 y σ = 1, pero podemos relacionar cualquier distribución normal con las distribuciones normales estándar usando la puntuación Z. Podemos transformar valores de x en valores de z.

    \[z=\frac {x-\mu}{\sigma}\]

    Por ejemplo, si una variable aleatoria normalmente distribuida tiene un μ = 6 y σ = 2, entonces un valor de x = 7 corresponde a una puntuación Z de 0.5.

    \[Z=\frac{7-6}{2}=0.5\]

    Esto te dice que 7 es la mitad de una desviación estándar por encima de su media. Podemos usar esta relación para encontrar probabilidades para cualquier variable aleatoria normal.

    07_fig33

    Figura 15. Una curva normal y normal estándar.

    Para encontrar el área para valores de X, una variable aleatoria normal, dibuje una imagen del área de interés, convierta los valores x a puntuaciones Z usando la puntuación Z y luego use la tabla normal estándar para encontrar áreas a la izquierda, a la derecha o entre ellas.

    \[z=\frac {x-\mu}{\sigma}\]

    Ejemplo\(\PageIndex{4}\):

    Los pesos de la población de venados adultos normalmente se distribuyen con µ = 110 lbs. y σ = 29.7 lb. Como biólogo determinas que un peso menor a 82 lbs. no es saludable y quieres saber qué proporción de tu población no es saludable.

    P (x<82)

    Image36098.PNG

    Figura 16. El área bajo una curva normal para P (x<82).

    Convertir 82 en una puntuación Z

    \[z=\frac{82-110}{29.7} = -0.94\]

    El valor x de 82 es 0.94 desviaciones estándar por debajo de la media.

    Image36106.PNG

    Figura 17. Área bajo una curva normal estándar para P (z<-0.94).

    Ir a la tabla normal estándar (lado negativo) y encontrar el área asociada con una puntuación Z de -0.94.

    Este es un problema de “área a la izquierda” por lo que puedes leer directamente de la tabla para obtener la probabilidad.

    \[P(x<82) = 0.1736\]

    Aproximadamente 17.36% de la población de venados adultos tiene bajo peso, O un venado elegido al azar tendrá una probabilidad de 17.36% de pesar menos de 82 lb.

    Ejemplo\(\PageIndex{5}\):

    Estadísticas del Centro Climático Regional del Medio Oeste indican que Jones City, que cuenta con un gran refugio de vida silvestre, obtiene un promedio de 36.7 pulg. de lluvia cada año con una desviación estándar de 5.1 pulg. La cantidad de lluvia se distribuye normalmente. ¿Durante qué porcentaje de los años Jones City obtiene más de 40 pulg. de lluvia?

    \[P(x > 40)\]

    Image36118.PNG

    Figura 18. Área bajo una curva normal para P (x>40).

    Solución

    $$z=\ frac {40-36.7} {5.1} =0.65\]

    $$ P (x>40) = (1-0.7422) = 0.2578\]

    Por aproximadamente 25.78% de los años, Jones City obtendrá más de 40 pulg. de lluvia.

    Evaluar la normalidad

    Si se desconoce la distribución y el tamaño de la muestra no es mayor a 30 (Teorema de Límite Central), tenemos que evaluar el supuesto de normalidad. Nuestro método principal es la gráfica de probabilidad normal. Esta gráfica grafica los datos observados, clasificados en orden ascendente, contra la puntuación Z “esperada” de ese rango. Si los datos de la muestra fueran tomados de una variable aleatoria normalmente distribuida, entonces la gráfica sería aproximadamente lineal.

    Examine la siguiente gráfica de probabilidad. La línea central es la relación que esperaríamos ver si los datos fueron dibujados a partir de una distribución perfectamente normal. Observe cómo los datos observados (puntos rojos) siguen vagamente esta relación lineal. Minitab también calcula una prueba de Anderson-Darling para evaluar la normalidad. La hipótesis nula para esta prueba es que los datos de la muestra han sido extraídos de una población normalmente distribuida. Un valor p mayor a 0.05 apoya la suposición de normalidad.

    314.png

    Figura 19. Una gráfica de probabilidad normal generada usando Minitab 16.

    Compare el histograma y la gráfica de probabilidad normal en este siguiente ejemplo. El histograma indica una distribución derecha sesgada.

    304.png

    Figura 20. Histograma y gráfica de probabilidad normal para datos de derecha sesgada.

    Los datos observados no siguen un patrón lineal y el valor p para la prueba A-D es menor a 0.005 lo que indica una distribución poblacional no normal.

    La normalidad no puede ser asumida. Siempre debes verificar esta suposición. Recuerda, las probabilidades que estamos encontrando provienen de la tabla NORMAL estándar. Si nuestros datos NO están distribuidos normalmente, entonces estas probabilidades NO APLICAN.

    • ¿Sabes si la población se distribuye normalmente?
    • ¿Tiene un tamaño de muestra lo suficientemente grande (n≥30)? ¿Recuerdas el teorema del límite central?
    • ¿Construyó una gráfica de probabilidad normal?

    This page titled 1.2: Distribución de probabilidad is shared under a CC BY-NC-SA 3.0 license and was authored, remixed, and/or curated by Diane Kiernan (OpenSUNY) via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.