Saltar al contenido principal
Library homepage
 
LibreTexts Español

13.1.4: Muestras estratificadas

  • Page ID
    101990
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Además de buscar una muestra grande, aleatoria y diversa, puedes mejorar tus posibilidades de obtener una muestra representativa estratificando la muestra. En el ejemplo del Concept Check sobre tomar las pruebas de drogas en momentos aleatorios, se cometió un error porque muchos más

    los conductores están en la carretera a las 5 de la tarde que a las 5 de la mañana El muestreo aleatorio en horarios estaría sesgado a favor de los conductores de las 5 de la mañana. Para eliminar este sesgo, el método de muestreo debe aprovechar este conocimiento de quién impulsa cuándo estratificando según la hora del día. Por ejemplo, si sabes que el 30 por ciento de los conductores están en la carretera de 5 p.m. a 6 p.m. y el 3% está en la carretera de 5 a.m. a 6 a.m., entonces asegúrese de que el 30 por ciento de los conductores muestreados sean seleccionados aleatoriamente de 5 p.m. a 6 p.m. y solo 3 por ciento de 5 a.m. a 6 a.m. Haga lo mismo para los otros tiempos de manejo si conoces los porcentajes para esos otros tiempos.

    pared erosionada de tierra que muestra capas estratificadas de suelo de diferentes colores

    Supongamos que está planeando una encuesta para saber cómo votarán los ciudadanos de Ohio en las próximas elecciones presidenciales. Puedes usar tus conocimientos de política para ayudarte a elegir la mejor muestra. Ya se cuenta con información política específica de que la raza de un elector es apta para afectar cómo va a votar. Supongamos que también sabe que, a pesar de que los ciudadanos de Ohio son 65 por ciento blancos y 30 por ciento negros, los votantes esperados serán 70 por ciento blancos y 25 por ciento negros. 1 Puedes usar toda esta información sobre la población votante para tomar una mejor muestra asegurándote de que tu muestra aleatoria contenga exactamente el 70 por ciento de votantes blancos y exactamente el 25 por ciento de votantes negros. Si tu encuesta realmente tuviera 73 por ciento de votantes blancos, sería muy recomendable que descartes aleatoriamente algunas de las respuestas de los votantes blancos hasta que bajen el número al 70 por ciento. La estratificación resultante sobre la raza mejorará las posibilidades de que tu muestra sea representativa. Sin embargo, la estratificación de la preferencia por el refresco de los votantes no ayudaría.

    La definición de estratificación utiliza el concepto útil de una variable. En términos generales, una variable es cualquier cosa que viene en varios tipos o cantidades. Hay diferentes tipos de carreras, por lo que la raza es una variable; hay diferentes montos de salarios, por lo que el salario es una variable; y así sucesivamente. Cada tipo o cantidad de la variable se denomina un valor posible de la variable. El blanco y el negro son dos valores de la variable de raza. Supongamos que una población (digamos, de personas) podría dividirse en diferentes grupos o estratos, de acuerdo con alguna característica variable (como la raza). Supongamos que los miembros de cada grupo tienen el mismo valor para esa variable (por ejemplo, todos los miembros de un grupo son negros, todos los miembros de otro grupo son blancos, y así sucesivamente). Supongamos que se toma una muestra bajo el requisito de que el porcentaje que tiene un valor dado (negro) de la variable (raza) debe ser el mismo que el porcentaje conocido del valor para la población en su conjunto. Si es así, entonces se ha tomado una muestra estratificada de esa población, y se dice que la muestra está estratificada sobre esa variable.

    La estratificación es clave para reducir el tamaño de la muestra, ahorrando tiempo y dinero. Si quieres saber cómo va a votar la gente por el candidato republicano en las próximas elecciones presidenciales, hablar con un solo elector seleccionado al azar obviamente sería una muestra demasiado pequeña. Sin embargo, obtener una muestra lo suficientemente grande suele ser un problema menor de lo que cabría esperar cuando se presta especial atención a la estratificación en grupos que probablemente voten de manera similar. La mayoría de los no profesionales creen que decenas de miles de personas necesitarían ser muestreadas. Le pregunté a mi vecino de al lado cuántos pensaba que se necesitarían, y me dijo: “Oh, al menos cien mil”. Sorprendentemente, 500 serían suficientes si la muestra se estratificara por raza, ingresos, tipo de empleo, partido político y otras variables importantes. Esta cifra de 500 asume que el encuestador solo necesita estar 95 por ciento seguro de que los resultados no están apagados en más de 2 por ciento. Si puedes vivir con un margen de error mayor que el 2 por ciento y menos confianza que el 95%, entonces puedes usar un tamaño de muestra mucho más pequeño.

    El primer gran triunfo del muestreo estratificado se produjo en 1936 cuando una encuesta no estratificada con un tamaño muestral de 10 millones de personas predijo que el presidente Roosevelt no sería reelegido. Una encuesta de George Gallup utilizando una pequeña encuesta estratificada de sólo 3 mil personas predijo correctamente que Roosevelt sería reelegido.

    Las variables más importantes que afectan al voto son el partido político, la raza, el sexo, los ingresos y la edad de los votantes. Si el encuestador no tiene idea de cuáles son estas variables que influirán en los resultados de la votación, entonces el encuestador no puede asegurar que la muestra sea diversa con respecto a estas variables, por lo que se necesitará una muestra muy grande para tener la misma confianza en los resultados que se podrían tener con un estratificado más pequeño muestra.

    Ejercicio\(\PageIndex{1}\)

    Su ingeniero de control de calidad realiza una inspección semanal de la nueva bebida de su compañía. Reúne una muestra aleatoria de 100 botellas producidas los lunes o martes. A lo largo de varias semanas, a lo sumo encuentra que una o dos botellas muestreadas cada semana son defectuosas. Por lo que concluye que a su proceso de fabricación le va bien en promedio todas las semanas, ya que su objetivo era que al menos el 98 por ciento de la bebida estuviera bien.

    Supongamos, sin embargo, que el ingeniero de control de calidad sepa que su planta produce una cantidad igual de la bebida en cada día de la semana y que produce bebidas solo de lunes a viernes. Describir la mejor manera para que el ingeniero de control de calidad mejore el muestreo prestando atención a la estratificación.

    a. Muestra una bebida de cada día de la semana.
    b. Escoja una muestra más grande y más aleatoria.
    c. Tomar un número igual de muestras los sábados y domingos también.
    d. Asegurarse de que el 20 por ciento de la muestra proviene de cada día de la semana.
    e. Muestree más de las botellas que serán entregadas a sus clientes más valorados.

    Contestar

    Respuesta (d). Sería bueno hacer la sugerencia en (b), pero no tiene nada que ver con la estratificación.


    1 Estos números no son confiables.


    This page titled 13.1.4: Muestras estratificadas is shared under a not declared license and was authored, remixed, and/or curated by Bradley H. Dowden.