13.1.2: Tamaño de la muestra

Última actualización
Guardar como PDF

Page ID: 101996

Bradley H. Dowden
California State University Sacramento

\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

Si escuchas a un comercial de televisión decir que cuatro de cada cinco médicos recomiendan el analgésico en el medicamento que se anuncia, podrías quedarte impresionado con el medicamento. No obstante, si se entera de que sólo cinco médicos fueron entrevistados, quedaría mucho menos impresionado. El tamaño de la muestra es importante.

¿Por qué? La respuesta tiene que ver con el hecho de que las estimaciones basadas en el muestreo son inductivas y por lo tanto inherentemente riesgosas. Cuanto mayor sea la muestra, mayores serán sus posibilidades de estar libre de distorsiones de inusualmente mala suerte durante la selección de la muestra. Si quieres predecir cómo votarán los votantes de California en las próximas elecciones, sería mejor tener una muestra no del todo aleatoria de 10,000 futuros votantes que una muestra perfectamente aleatoria de dos futuros votantes.

Para maximizar la información que pueda obtener sobre la población, querrá aumentar el tamaño de su muestra. Sin embargo, generalmente se enfrentan a límites prácticos en el tamaño; el muestreo puede ser costoso, difícil o ambos.

Al crear el censo de gobierno, es sumamente difícil contactar y contar a aquellas personas que viven temporalmente en el sofá del departamento de un amigo y las que viven en sus autos y no tienen domicilio y las que se están mudando a un nuevo trabajo en un estado diferente. Puedes hacer buenas estimaciones sobre estas personas, pero si estás obligado a ignorar a alguien con quien no hayas hablado durante tu toma del censo, entonces subrepresentarás a este tipo de personas en los resultados de tu censo. Personas que se quejan de que el censo del gobierno hará una conjetura educada sobre cuántas personas viven en una ciudad aunque no hayan contado a todas las personas, nunca parecen quejarse cuando su médico toma muestras de su propia sangre en lugar de tomarla toda para examinarla.

Entonces, ¿cuándo es el tamaño de su muestra lo suficientemente grande para sus propósitos? Esta es una pregunta fascinante y difícil. Para ilustrar, supongamos que está interesado en vender sistemas de alimentación mecánica a los agricultores de su estado. Te gustaría saber qué porcentaje de ellos no poseen ya un sistema de alimentación mecánica, serán tus clientes potenciales. Sabiendo que este tipo de información nunca ha sido recopilada, podrías intentar recopilarla tú mismo contactando a los agricultores. Dado que sería difícil y costoso contactar a cada agricultor, te interesaría obtener tu respuesta de una muestra de pequeño tamaño. Si no le importa si su estimación del porcentaje de agricultores sin un sistema de alimentación mecánica está apagada en más o menos 10 por ciento, puede muestrear muchos menos agricultores que si necesita que su respuesta esté dentro del 1 por ciento de la respuesta correcta (desconocida). Los estadísticos expresarían este mismo punto diciendo que un margen de error del 10 por ciento requiere un tamaño de muestra menor que un margen de error del 1 por ciento. Siendo iguales todas las demás cosas, preferirías tener un pequeño margen de error que uno grande.

Supongamos que puedes vivir con el margen de error del 10 por ciento. Ahora bien, ¿qué tan seguro necesitas estar de que tu estimación caerá en ese intervalo de más o menos 10 por ciento? Si solo necesitas estar 90 por ciento seguro, entonces necesitarás un tamaño de muestra mucho más pequeño entonces si necesitas estar 97 por ciento seguro. Los estadísticos expresarían este mismo punto diciendo que un nivel de confianza del 90 por ciento requiere un tamaño de muestra más pequeño que un nivel de confianza del 97 por ciento. Justo exactamente cuánto más pequeño es una cuestión de intrincada teoría estadística en la que no entraremos aquí, aunque exploraremos algunos ejemplos específicos más adelante.

Un margen de error es un margen de seguridad. En ocasiones podemos ser específicos y cuantificar este margen, es decir, ponerle un número como el 6%. Podemos decir que nuestro muestreo mostró que el porcentaje de agricultores sin sistema de alimentación mecánica es de 60 por ciento más o menos 6 por ciento. En ocasiones expresamos la idea vagamente diciendo que el porcentaje es de alrededor del 60 por ciento. En cualquier caso, seamos específicos o no, cuanto mayor sea el margen de error que podamos permitir, menor será el tamaño de la muestra que necesitamos.

Para apreciar la conveniencia de un pequeño margen de error, imagina que estás tratando de pronosticar las temperaturas del mañana en ciudades de todo el mundo y afirmas que tienes un gran modelo para hacer esto, cuyo único efecto secundario es que tu modelo predice una temperatura entre cero absoluto y la temperatura del sol, un gigantesco margen de error. Utiliza tu modelo y predices que la temperatura de mañana en la ciudad de Nueva York será de tres mil grados. Si afirmas que tu predicción está dentro de tu margen de error, estarás en lo cierto, pero tu modelo claramente será inútil porque queremos predicciones de temperatura que tengan un margen de error mucho menor.