Saltar al contenido principal
LibreTexts Español

6.4: Evaluar la normalidad

  • Page ID
    149821
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Se ha asumido que las distribuciones que has visto hasta este punto están distribuidas normalmente, pero ¿cómo se determina si se distribuye normalmente? Una forma es tomar una muestra y mirar la muestra para determinar si parece normal. Si la muestra se ve normal, entonces lo más probable es que la población también lo esté. Aquí hay algunas pautas que se utilizan para ayudar a tomar esa determinación.

    1. Histograma: Hacer un histograma. Para una distribución normal, el histograma debe ser aproximadamente en forma de campana. Para muestras pequeñas, esto no es muy preciso, y se necesita otro método. Una distribución puede no verse normalmente distribuida desde el histograma, pero aún así puede distribuirse normalmente.
    2. Valores atípicos: Para una distribución normal, no debe haber más de un valor atípico. Una forma de verificar los valores atípicos es usar una gráfica de caja modificada. Los valores atípicos son valores que se muestran como puntos fuera del resto de los valores. Si no tiene una gráfica de caja modificada, los valores atípicos son aquellos valores de datos que son: Por
      encima de Q3, el tercer cuartil, por una cantidad mayor que 1.5 veces el rango intercuartil (IQR) Por
      debajo de Q1, el primer cuartil, por una cantidad mayor que 1.5 veces el rango intercuartil (IQR)

      Nota

      Si hay un valor atípico, ese valor atípico podría tener un efecto dramático en los resultados sobre todo si se trata de un valor atípico extremo. No obstante, hay momentos en los que una distribución tiene más de un valor atípico, pero todavía se distribuye normalmente. La pauta de un solo valor atípico es solo una pauta.

    3. Gráfica cuantil normal (o gráfica de probabilidad normal): Esta gráfica se proporciona a través de software estadístico en una computadora o calculadora gráfica. Si los puntos se encuentran cerca de una línea, los datos provienen de una distribución que es aproximadamente normal. Si los puntos no se encuentran cerca de una línea o muestran un patrón que no es una línea, es probable que los datos provengan de una distribución que normalmente no se distribuye.

    Para crear un histograma en el TI-83/84:

    1. Entra en el menú STAT y luego elige 1: Editar
      Captura de pantalla (95) .png
      figura\(\PageIndex{1}\): Menú STAT en TI-83/84
    2. Escriba sus valores de datos en L1.
    3. Ahora haga clic en STAT PLOT (\(2^{\text { nd }} Y=\)).
      Captura de pantalla (96) .png
      Figura\(\PageIndex{2}\): Menú STAT PLOT en TI-83/84
    4. Utilice 1:Parque1. Presione ENTER.
      Captura de pantalla (97) .png
      Figura\(\PageIndex{3}\): Menú Plot1 en TI-83/84
    5. Verás una nueva ventana. Lo primero que quieres hacer es encender la trama. En este punto deberías estar encendido, solo tienes que pulsar ENTRAR. Hará On oscuro.
    6. Ahora flecha hacia abajo a Tipo: y flecha a la derecha a la gráfica que parece un histograma (3º desde la izquierda en la fila superior).
    7. Ahora flecha hacia abajo a Xlist. Asegúrate de que esto dice L1. Si no lo hace, entonces pon ahí L1 (2do número 1). Freq: debe ser un 1.
      Captura de pantalla (98) .png
      Figura\(\PageIndex{4}\): Menú Traza1 en TI-83/84 Configuración para Histograma
    8. Ahora necesitas configurar la ventana correcta para graficar. Haga clic en VENTANA. Es necesario configurar los ajustes para la variable x. Xmin debe ser su valor de datos más pequeño. Xmax solo debería ser un valor lo suficientemente por encima de su valor de datos más alto, pero no demasiado alto. Xscl es el ancho de tu clase que calculaste. Ymin debería ser 0 y Ymax debería estar por encima de lo que crees que va a ser la frecuencia más alta. Siempre puedes cambiar esto si es necesario. Yscl es la frecuencia con la que le gustaría ver una marca de verificación en el eje y.
    9. Ahora presione GRAPADO. Verás un histograma.

    Para encontrar el IQR y crear un diagrama de caja en el TI-83/84:

    1. Vaya al menú STAT y luego elija 1:Editar
      Captura de pantalla (100) .png
      Figura\(\PageIndex{5}\): Menú STAT en TI-83/84
    2. Escriba sus valores de datos en L1. Si L1 tiene datos en él, flecha hacia arriba hasta el nombre L1, haga clic en CLEAR y luego presione ENTRAR. Ahora se borrará la columna y podrá escribir los datos en.
    3. Entra en el menú STAT, pasa a CALC y elige Estadísticas 1-Var. Presione ENTER, luego escriba L1 (2nd 1) y luego ENTER. Esto te dará las estadísticas resumidas. Si presionas la flecha hacia abajo, verás el resumen de cinco números.
    4. Para dibujar la trama de caja presione 2da STAT PLOT.
      Captura de pantalla (101) .png
      Figura\(\PageIndex{6}\): Menú STAT PLOT en TI-83/84
    5. Utilice Plot1. Presione INTRO
      Captura de pantalla (102) .png
      Figura\(\PageIndex{7}\): Menú Traza1 en TI-83/84 Configuración para Gráfica de Caja
    6. Ponga el cursor en Encendido y pulse Intro para activar la trama. Use la flecha hacia abajo y la flecha derecha para resaltar la gráfica de caja en el medio de la segunda fila de tipos y luego presione ENTRAR. Establezca la Lista de Datos en L1 (ya podría decir eso) y deje Freq como 1.
    7. Ahora dígale a la calculadora la configuración para las unidades en el eje x para que pueda ver toda la parcela. La calculadora lo hará automáticamente si presionas ZOOM, que está en el medio de la fila superior.
      Captura de pantalla (103) .png
      Figura\(\PageIndex{8}\): Menú ZOOM en TI-83/84
      Luego use la flecha hacia abajo para llegar a 9:ZoomStat y presione ENTRAR. Se dibujará la trama de caja.
      Captura de pantalla (102) .png
      Figura\(\PageIndex{9}\): Menú ZOOM en TI-83/84 con ZoomStat

    Para crear una gráfica de cuantiles normales en el TI-83/84

    1. Entra en el menú STAT y luego elige 1:Editar
      Captura de pantalla (105) .png
      figura\(\PageIndex{10}\): Menú STAT en TI-83/84
    2. Escriba sus valores de datos en L1. Si L1 tiene datos en él, flecha hacia arriba hasta el nombre L1, haga clic en CLEAR y luego presione ENTRAR. Ahora se borrará la columna y podrá escribir los datos en.
    3. Ahora haga clic en STAT PLOT (\(2^{\text { nd }} Y=\)). Tienes tres parcelas estadísticas para elegir.
      Captura de pantalla (106) .png
      Figura\(\PageIndex{11}\): Menú STAT PLOT en TI-83/84
    4. Utilice 1:Parque1. Presione ENTER.
    5. Ponga el cursor sobre la palabra On y presione ENTRAR. Esto enciende la trama. Flecha abajo a Type: y usa la flecha derecha para moverte a la última gráfica (parece una gráfica lineal creciente). Establezca la Lista de Datos en L1 (ya podría decir eso) y establezca el Eje de Datos en Y. La Marca depende de usted.
      Captura de pantalla (107) .png
      Figura\(\PageIndex{12}\): Menú Traza1 en Configuración TI-83/84 para Gráfica Cuantil Normal
    6. Ahora es necesario configurar la ventana correcta en la que graficar. Haga clic en VENTANA. Es necesario configurar los ajustes para la variable x. Xmin debe ser -4. Xmax debe ser 4. Xscl debe ser 1. Ymin e Ymax se basan en tus datos, el Ymin debería estar por debajo de tu valor de datos más bajo e Ymax debería estar por encima de tu valor de datos más alto. Yscl es la frecuencia con la que le gustaría ver una marca de verificación en el eje y.
    7. Ahora presione GRAPADO. Verás la trama cuantil normal.

    Para crear un histograma en R:

    Poner la variable en el uso de variable<-c (escriba los datos con comas entre valores) usando un nombre para la variable que tenga sentido para el problema. El comando para histograma es hist (variable). A continuación, puede copiar el histograma en un programa de procesamiento de textos. Hay opciones que puedes poner para etiquetas de título y ejes. Consulte la sección 2.2 para conocer los comandos de esos.

    Para crear una gráfica de caja modificada en R:

    Poner la variable en el uso de variable<-c (escriba los datos con comas entre valores) usando un nombre para la variable que tenga sentido para el problema. El comando para la gráfica de caja es boxplot (variable). A continuación, puede copiar la trama de caja en un programa de procesamiento de textos. Hay opciones que puede incluir para etiquetas de título, orientación horizontal y ejes. Consulte la sección 3.3 para conocer los comandos de esos.

    Para crear una gráfica de cuantiles normales en R:

    Poner la variable en el uso de variable<-c (escriba los datos con comas entre valores) usando un nombre para la variable que tenga sentido para el problema. El comando para la gráfica cuantil normal es qqnorm (variable). A continuación, puede copiar la gráfica cuantil normal en un programa de procesamiento de textos.

    Date cuenta de que tu variable aleatoria puede estar normalmente distribuida, incluso si la muestra falla en las tres pruebas. Sin embargo, si el histograma definitivamente no se ve simétrico y en forma de campana, hay valores atípicos que son muy extremos, y la gráfica de probabilidad normal no parece lineal, entonces puedes estar bastante seguro de que el conjunto de datos no proviene de una población que normalmente se distribuye.

    Ejemplo\(\PageIndex{1}\) is it normal?

    En Kiama, NSW, Australia, hay una sopladura. Los datos en la tabla #6 .4.1 son tiempos en segundos entre erupciones (“Kiama blowhole eruptions”, 2013). ¿Los datos provienen de una población que normalmente se distribuye?

    83 51 87 60 28 95 8 27
    15 10 18 16 29 54 91 8
    17 55 10 35 47 77 36 17
    21 36 18 40 10 7 34 27
    28 56 8 25 68 146 89 18
    73 69 9 37 10 82 29 8
    60 61 61 18 169 25 8 26
    11 83 11 42 17 14 9 12
    Tabla\(\PageIndex{1}\): Tiempo (en segundos) entre erupciones de soplo de Kiama
    1. Declarar la variable aleatoria
    2. Dibuja un histograma.
    3. Encuentra el número de valores atípicos.
    4. Dibuja la gráfica cuantil normal.
    5. ¿Los datos provienen de una población que normalmente se distribuye?

    Solución

    a. x = tiempo en segundos entre erupciones de Kiama Blowhole

    b. El histograma producido está en la Figura\(\PageIndex{13}\).

    Captura de pantalla (108) .png
    Figura\(\PageIndex{13}\): Histograma para la Sopladora de Kiama

    Esto parece sesgado a la derecha y no simétrico.

    c. La gráfica de caja está en la Figura\(\PageIndex{14}\).

    Captura de pantalla (109) .png
    Figura\(\PageIndex{14}\): Gráfica de Caja Modificada de TI-83/83 para Sopladora Kiama

    Hay dos valores atípicos. En lugar de usar:

    \(I Q R=Q 3-Q 1=60-14.5=45.5\)segundos

    \(1.5 * I Q R=1.5 * 45.5=68.25\)segundos

    \(Q 1-1.5^{*} I Q R=14.5-68.25=-53.75\)segundos

    \(Q 3+1.5 * I Q R=60+68.25=128.25\)segundos

    Los valores atípicos son cualquier número mayor que 128.25 segundos y menor que -53.75 segundos. Dado que todos los números son medidas de tiempo, entonces ningún valor de datos es menor que 0 o segundos para el caso. Hay dos números que superan los 128.25 segundos, por lo que hay dos valores atípicos. Dos valores atípicos no son indicios reales de que la muestra no proviene de una distribución normal, pero el hecho de que ambos estén muy por encima de 128.25 segundos es una indicación de un problema.

    d. La gráfica de cuantiles normales se encuentra en la Figura\(\PageIndex{15}\).

    Captura de pantalla (110) .png
    Figura\(\PageIndex{15}\): Gráfica de probabilidad normal

    Esta gráfica se parece más a un crecimiento exponencial que lineal.

    e. Considerando que el histograma está sesgado a la derecha, hay dos valores atípicos extremos, y la gráfica de probabilidad normal no se ve lineal, entonces la conclusión es que esta muestra no es de una población que se distribuye normalmente.

    Ejemplo\(\PageIndex{2}\) is it normal?

    Una forma de medir la inteligencia es con un puntaje de CI. \(\PageIndex{2}\)El ejemplo contiene 50 puntajes de CI. Determinar si la muestra proviene de una población que se distribuye normalmente.

    78 92 96 100 67 105 109 75 127 111
    93 114 82 100 125 67 94 74 81 98
    102 108 81 96 103 91 90 96 86 92
    84 92 90 103 115 93 85 116 87 106
    85 88 106 104 102 98 116 107 102 89
    Tabla\(\PageIndex{2}\): Puntajes de CI
    1. Declarar la variable aleatoria.
    2. Dibuja un histograma.
    3. Encuentra el número de valores atípicos.
    4. Dibuja la gráfica cuantil normal.
    5. ¿Los datos provienen de una población que normalmente se distribuye?

    Solución

    a. x = Puntuación IQ

    b. El histograma está en la Figura\(\PageIndex{16}\).

    Captura de pantalla (111) .png
    Figura\(\PageIndex{16}\): Histograma para IQ Score

    Esto parece algo simétrico, aunque podría pensarse como ligeramente sesgado a la derecha.

    c. La gráfica de caja modificada se encuentra en la Figura\(\PageIndex{17}\).

    Captura de pantalla (112) .png
    Figura\(\PageIndex{17}\): Salida de TI-83/84 para IQ Score

    No hay valores atípicos.

    O usando valores atípicos

    \(I Q R=Q 3-Q 1=105-87=18\)

    \(1.5^{*} I Q R=1.5^{*} 18=27\)

    \(Q 1 -1.5 I Q R=87-27=60\)

    \(Q 3+1.5 I Q R=105+27=132\)

    son cualquier número mayor que 132 y menor que 60. Dado que el número máximo es 127 y el mínimo es 67, no hay valores atípicos.

    d. La gráfica de cuantiles normales se encuentra en la Figura\(\PageIndex{18}\).

    Captura de pantalla (113) .png
    Figura\(\PageIndex{18}\): Gráfica de cuantiles normales

    Esta gráfica se ve bastante lineal.

    e. Considerando que el histograma es algo simétrico, no hay valores atípicos, y la gráfica de probabilidad normal se ve lineal, entonces la conclusión es que esta muestra es de una población que normalmente se distribuye.

    Testo

    Ejercicio\(\PageIndex{1}\)

    1. Los datos de colesterol se recolectaron en pacientes cuatro días después de sufrir un ataque cardíaco. Los datos están en Ejemplo\(\PageIndex{3}\). Determinar si los datos son de una población que normalmente se distribuye.
      218 234 214 116 200 276 146
      182 238 288 190 236 244 258
      240 294 220 200 220 186 352
      202 218 248 278 248 270 242
      Tabla\(\PageIndex{3}\): Datos de colesterol recopilados cuatro días después de un ataque cardíaco
    2. El tamaño de los peces es muy importante para la pesca comercial. Un estudio realizado en 2012 recolectó las longitudes del bacalao del Atlántico capturado en redes en Karlskrona (Ovejard, Berndt & Lunneryd, 2012). Los datos basados en la información del estudio se encuentran en Ejemplo\(\PageIndex{4}\). Determinar si los datos son de una población que normalmente se distribuye.
      48 50 50 55 53 50 49 52
      61 48 45 47 53 46 50 48
      42 44 50 60 54 48 50 49
      53 48 52 56 46 46 47 48
      48 49 52 47 51 48 45 47
      Tabla\(\PageIndex{4}\): Largo de Bacalao Atlántico
    3. El Proyecto MONICA de la OMS recopiló datos de presión arterial para personas en China (Kuulasmaa, Hense & Tolonen, 1998). Los datos basados en la información del estudio se encuentran en Ejemplo\(\PageIndex{5}\). Determinar si los datos son de una población que normalmente se distribuye.
      114 141 154 137 131 132 133 156 119
      138 86 122 112 114 177 128 137 140
      171 129 127 104 97 135 107 136 118
      92 182 150 142 97 140 106 76 115
      119 125 162 80 138 124 132 143 119
      Tabla\(\PageIndex{5}\): Valores de presión arterial para personas en China
    4. Las lluvias anuales para Sydney, Australia se dan en Ejemplo\(\PageIndex{6}\). (“Máximos anuales de,” 2013). ¿Se puede suponer que la precipitación se distribuye normalmente?
      146.8 383 90.9 178.1 267.5 95.5 156.5 180
      90.9 139.7 200.2 171.7 187.2 184.9 70.1 58
      84.1 55.6 133.1 271.8 135.9 71.9 99.4 110.6
      47.5 97.8 122.7 58.4 154.4 173.7 118.8 88
      84.6 171.5 254.3 185.9 137.2 138.9 96.2 85
      45.2 74.7 264.9 113.8 133.4 68.1 156.4
      Tabla\(\PageIndex{6}\): Lluvias anuales en Sydney, Australia
    Contestar

    1. Distribuido normalmente

    3. Distribuido normalmente


    This page titled 6.4: Evaluar la normalidad is shared under a CC BY-SA 4.0 license and was authored, remixed, and/or curated by Kathryn Kozak via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.