4.8: Muestras, poblaciones y muestreo

Última actualización
Guardar como PDF

Page ID: 150493

\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

\( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)

( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)

\( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

\( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)

\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

\( \newcommand{\Span}{\mathrm{span}}\)

\( \newcommand{\id}{\mathrm{id}}\)

\( \newcommand{\Span}{\mathrm{span}}\)

\( \newcommand{\kernel}{\mathrm{null}\,}\)

\( \newcommand{\range}{\mathrm{range}\,}\)

\( \newcommand{\RealPart}{\mathrm{Re}}\)

\( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

\( \newcommand{\Argument}{\mathrm{Arg}}\)

\( \newcommand{\norm}[1]{\| #1 \|}\)

\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

\( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)

\( \newcommand{\vectorA}[1]{\vec{#1}} % arrow\)

\( \newcommand{\vectorAt}[1]{\vec{\text{#1}}} % arrow\)

\( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

\( \newcommand{\vectorC}[1]{\textbf{#1}} \)

\( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)

\( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)

\( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)

\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

Recuerde, el papel de la estadística descriptiva es resumir de manera concisa lo que sí sabemos. En contraste, el propósito de la estadística inferencial es “aprender lo que no sabemos de lo que hacemos”. ¿Qué tipo de cosas nos gustaría aprender? ¿Y cómo los aprendemos? Estas son las preguntas que se encuentran en el corazón de las estadísticas inferenciales, y tradicionalmente se dividen en dos “grandes ideas”: estimación y prueba de hipótesis. El objetivo en este capítulo es introducir la primera de estas grandes ideas, la teoría de la estimación, pero primero hablaremos de la teoría del muestreo porque la teoría de la estimación no tiene sentido hasta que entiendas el muestreo. Entonces, este capítulo se divide en teoría de muestreo, y cómo hacer uso de la teoría del muestreo para discutir cómo piensan los estadísticos sobre la estimación. Ya hemos hecho muchos muestreos, así que ya estás familiarizado con algunas de las grandes ideas.

La teoría del muestreo juega un papel muy importante en la especificación de los supuestos en los que se basan sus inferencias estadísticas. Y para hablar de “hacer inferencias” de la manera en que los estadísticos piensan al respecto, necesitamos ser un poco más explícitos sobre qué es de lo que estamos sacando inferencias (la muestra) y de qué es lo que estamos haciendo inferencias (la población).

En casi todas las situaciones de interés, lo que tenemos a nuestra disposición como investigadores es una muestra de datos. Podríamos haber realizado experimentos con algún número de participantes; una compañía de encuestas podría haber llamado por teléfono a algunas personas para hacer preguntas sobre intenciones de voto; etc. Independientemente: el conjunto de datos disponibles para nosotros es finito e incompleto. No podemos conseguir que todas las personas del mundo hagan nuestro experimento; una empresa de encuestas no tiene el tiempo ni el dinero para llamar a todos los votantes del país etc. En nuestra anterior discusión sobre estadísticas descriptivas, esta muestra era lo único que nos interesaba. Nuestro único objetivo era encontrar formas de describir, resumir y graficar esa muestra. Esto está a punto de cambiar.

Definición de una población

Una muestra es algo concreto. Puedes abrir un archivo de datos, y ahí están los datos de tu muestra. Una población, en cambio, es una idea más abstracta. Se refiere al conjunto de todas las personas posibles, o todas las observaciones posibles, sobre las que se quiere sacar conclusiones, y generalmente es mucho más grande que la muestra. En un mundo ideal, el investigador iniciaría el estudio con una idea clara de lo que es la población de interés, ya que el proceso de diseñar un estudio y probar hipótesis sobre los datos que produce sí depende de la población sobre la que se quiera hacer declaraciones. Sin embargo, eso no siempre sucede en la práctica: generalmente el investigador tiene una idea bastante vaga de lo que es la población y diseña el estudio lo mejor que puede sobre esa base.

A veces es fácil exponer la población de interés. Por ejemplo, en el ejemplo de “empresa de votación”, la población consistía en todos los votantes inscritos a la vez del estudio —millones de personas—. La muestra fue un conjunto de 1000 personas que pertenecen todas a esa población. En la mayoría de las situaciones la situación es mucho menos sencilla. En un típico experimento psicológico, determinar la población de interés es un poco más complicado. Supongamos que realizo un experimento utilizando como participantes 100 estudiantes de pregrado. Mi objetivo, como científico cognitivo, es tratar de aprender algo sobre cómo funciona la mente. Entonces, cuál de los siguientes contaría como “la población”:

¿Todos los estudiantes de licenciatura en psicología de la Universidad de Adelaida?
Estudiantes de licenciatura en psicología en general, ¿en cualquier parte del mundo?
¿Australianos que viven actualmente?
Australianos de edades similares a mi muestra?
¿Alguien vivo actualmente?
¿Algún ser humano, pasado, presente o futuro?
¿Algún organismo biológico con un grado suficiente de inteligencia operando en un ambiente terrestre?
¿Algún ser inteligente?

Cada uno de estos define un verdadero grupo de entidades poseedoras de la mente, todas las cuales podrían ser de mi interés como científico cognitivo, y no está nada claro cuál debería ser la verdadera población de interés.

Muestras simples al azar

Independientemente de cómo definamos a la población, el punto crítico es que la muestra es un subconjunto de la población, y nuestro objetivo es utilizar nuestro conocimiento de la muestra para hacer inferencias sobre las propiedades de la población. La relación entre ambos depende del procedimiento por el cual se seleccionó la muestra. Este procedimiento se conoce como método de muestreo, y es importante entender por qué es importante.

Para que las cosas sean simples, imagina que tenemos una bolsa que contiene 10 chips. Cada chip tiene una letra única impresa en él, por lo que podemos distinguir entre las 10 fichas. Las fichas vienen en dos colores, blanco y negro.

Muestreo aleatorio simple sin reemplazo. — Figura\(\PageIndex{1}\): Muestreo aleatorio simple sin reemplazo de una población finita.

Este conjunto de fichas es la población de interés, y se representa gráficamente a la izquierda de la Figura\(\PageIndex{1}\).

Como puedes ver al mirar la foto, hay 4 chips negros y 6 chips blancos, pero claro que en la vida real no sabríamos eso a menos que busquemos en la bolsa. Ahora imagina que ejecutas el siguiente “experimento”: sacudes la bolsa, cierras los ojos y sacas 4 fichas sin volver a meter ninguna de ellas en la bolsa. Primero sale el\(a\) chip (negro), después el\(c\) chip (blanco), después\(j\) (blanco) y luego finalmente\(b\) (negro). Si quisieras, entonces podrías volver a poner todas las fichas en la bolsa y repetir el experimento, como se muestra en el lado derecho de la Figura\(\PageIndex{1}\). Cada vez se obtienen resultados diferentes, pero el procedimiento es idéntico en cada caso. El hecho de que un mismo procedimiento pueda conducir a diferentes resultados cada vez, nos referimos a él como un proceso aleatorio. No obstante, debido a que sacudimos la bolsa antes de sacar las fichas, parece razonable pensar que cada ficha tiene las mismas posibilidades de ser seleccionada. Un procedimiento en el que cada miembro de la población tiene las mismas posibilidades de ser seleccionado se denomina muestra aleatoria simple. El hecho de que no volviéramos a meter las fichas en la bolsa después de sacarlas significa que no se puede observar lo mismo dos veces, y en tales casos se dice que las observaciones fueron muestreadas sin reemplazo.

Para ayudar a comprender la importancia del procedimiento de muestreo, considere una forma alternativa en la que se podría haber realizado el experimento. Supongamos que mi hijo de 5 años había abierto la bolsa, y decidió sacar cuatro chips negros sin volver a meter ninguna de ellas en la bolsa. Este esquema de muestreo sesgado se representa en la Figura\(\PageIndex{2}\).

Muestreo sesgado sin reemplazo. — Figura\(\PageIndex{2}\): Muestreo sesgado sin reemplazo de una población finita.

Ahora considere el valor probatorio de ver 4 chips negros y 0 chips blancos. Claramente, depende del esquema de muestreo, ¿no? Si sabes que el esquema de muestreo está sesgado para seleccionar solo chips negros, entonces ¡una muestra que consiste solo en chips negros no te dice mucho sobre la población! Por esta razón, a los estadísticos les gusta mucho cuando un conjunto de datos puede considerarse una simple muestra aleatoria, porque facilita mucho el análisis de datos.

Vale la pena mencionar un tercer procedimiento. Esta vez cerramos los ojos, agitamos la bolsa y sacamos un chip. Esta vez, sin embargo, registramos la observación y luego volvemos a meter el chip en la bolsa. Nuevamente cerramos los ojos, agitamos la bolsa y sacamos un chip. Después repetimos este procedimiento hasta que tengamos 4 fichas. Los conjuntos de datos generados de esta manera siguen siendo simples muestras aleatorias, pero debido a que volvemos a poner las astillas en la bolsa inmediatamente después de dibujarlas se le conoce como una muestra con reemplazo. La diferencia entre esta situación y la primera es que es posible observar varias veces al mismo miembro de la población, como se ilustra en la Figura\(\PageIndex{3}\).

Muestreo aleatorio simple con reemplazo. — Figura\(\PageIndex{3}\): Muestreo aleatorio simple con reemplazo de una población finita.

La mayoría de los experimentos de psicología tienden a ser muestreos sin reemplazo, porque a la misma persona no se le permite participar en el experimento dos veces. Sin embargo, la mayor parte de la teoría estadística se basa en el supuesto de que los datos surgen de una simple muestra aleatoria con reemplazo. En la vida real, esto muy raramente importa. Si la población de interés es grande (e.g., ¡tiene más de 10 entidades!) la diferencia entre el muestreo con y sin reemplazo es demasiado pequeña para preocuparse. La diferencia entre muestras aleatorias simples y muestras sesgadas, por otro lado, no es tan fácil de descartar.

La mayoría de las muestras no son simples muestras aleatorias

Como puede ver al mirar la lista de posibles poblaciones que mostré anteriormente, es casi imposible obtener una muestra aleatoria simple de la mayoría de las poblaciones de interés. Cuando realizo experimentos, consideraría un milagro menor si mis participantes resultaran ser una muestra aleatoria de los estudiantes de licenciatura en psicología de la universidad de Adelaida, aunque esta es, con mucho, la población más estrecha a la que podría querer generalizar. Una discusión exhaustiva de otros tipos de esquemas de muestreo está más allá del alcance de este libro, pero para darle una idea de lo que hay ahí afuera enumeraré algunos de los más importantes:

Muestreo estratificado. Supongamos que su población está (o puede ser) dividida en varias subpoblaciones diferentes, o estratos. Quizás estés realizando un estudio en varios sitios diferentes, por ejemplo. En lugar de tratar de muestrear aleatoriamente de la población en su conjunto, en su lugar, intenta recolectar una muestra aleatoria separada de cada uno de los estratos. El muestreo estratificado a veces es más fácil de hacer que el muestreo aleatorio simple, especialmente cuando la población ya está dividida en los distintos estratos. También puede ser más eficiente que el muestreo aleatorio simple, especialmente cuando algunas de las subpoblaciones son raras. Por ejemplo, al estudiar esquizofrenia sería mucho mejor dividir la población en dos estratos (esquizofrénicos y no esquizofrénicos), para luego muestrear un número igual de personas de cada grupo. Si seleccionaste personas al azar, obtendrías tan pocas personas esquizofrénicas en la muestra que tu estudio sería inútil. Este tipo específico de muestreo estratificado se conoce como sobremuestreo porque hace un intento deliberado de sobrerepresentar grupos raros.
El muestreo de bolas de nieve es una técnica que resulta especialmente útil cuando se toma de muestras de una población “oculta” o de difícil acceso, y es especialmente común en las ciencias sociales. Por ejemplo, supongamos que los investigadores quieren realizar una encuesta de opinión entre personas transgénero. Es posible que el equipo de investigación solo tenga datos de contacto de algunas personas trans, por lo que la encuesta comienza pidiéndoles que participen (etapa 1). Al final de la encuesta, se pide a los participantes que proporcionen datos de contacto de otras personas que puedan querer participar. En la etapa 2, se encuestan esos nuevos contactos. El proceso continúa hasta que los investigadores cuenten con datos suficientes. La gran ventaja del muestreo de bolas de nieve es que te obtiene datos en situaciones que de otro modo serían imposibles de obtener. En el lado estadístico, la principal desventaja es que la muestra es altamente no aleatoria, y no aleatoria en formas difíciles de abordar. En el lado de la vida real, la desventaja es que el procedimiento puede ser poco ético si no se maneja bien, porque las poblaciones ocultas suelen estar ocultas por alguna razón. Elegí a las personas transgénero como ejemplo aquí para destacar esto: si no tuviste cuidado podrías terminar sacando a personas que no quieren ser descubiertas (muy, muy mala forma), e incluso si no cometes ese error puede ser intrusivo usar las redes sociales de las personas para estudiarlas. Ciertamente es muy difícil obtener el consentimiento informado de las personas antes de contactarlas, sin embargo, en muchos casos el simple hecho de contactarlos y decir “hey queremos estudiarte” puede ser hiriente. Las redes sociales son cosas complejas, y el hecho de que puedas usarlas para obtener datos no siempre significa que debas hacerlo.
El muestreo de conveniencia es más o menos lo que parece. Las muestras se eligen de una manera que sea conveniente para el investigador, y no se seleccionan al azar de la población de interés. El muestreo de bola de nieve es un tipo de muestreo de conveniencia, pero hay muchos otros. Un ejemplo común en psicología son los estudios que se basan en estudiantes de licenciatura en psicología. Estas muestras son generalmente no aleatorias en dos aspectos: en primer lugar, depender de estudiantes de psicología de pregrado automáticamente significa que sus datos están restringidos a una sola subpoblación. En segundo lugar, los estudiantes suelen elegir en qué estudios participan, por lo que la muestra es un subconjunto autoseleccionado de estudiantes de psicología, no un subconjunto seleccionado al azar. En la vida real, la mayoría de los estudios son muestras de conveniencia de una forma u otra. Esto a veces es una limitación severa, pero no siempre.

¿Cuánto importa si no tienes una simple muestra aleatoria?

Bien, entonces la recolección de datos del mundo real tiende a no involucrar agradables muestras aleatorias simples. ¿Eso importa? Un poco de pensamiento debería dejarte claro que puede importar si tus datos no son una simple muestra aleatoria: solo piensa en la diferencia entre Figuras\(\PageIndex{1}\) y\(\PageIndex{2}\). Sin embargo, no es tan malo como suena. Algunos tipos de muestras sesgadas no son problemáticos. Por ejemplo, cuando se usa una técnica de muestreo estratificado, realmente sabes cuál es el sesgo porque lo creaste deliberadamente, a menudo para aumentar la efectividad de tu estudio, y hay técnicas estadísticas que puedes usar para ajustar los sesgos que has introducido (no cubierto en este libro!). Entonces en esas situaciones no es un problema.

Sin embargo, de manera más general, es importante recordar que el muestreo aleatorio es un medio para un fin, no el final en sí mismo. Supongamos que ha confiado en una muestra de conveniencia y, como tal, puede asumir que es sesgada. Un sesgo en tu método de muestreo solo es un problema si te hace sacar conclusiones equivocadas. Cuando se ve desde esa perspectiva, yo diría que no necesitamos que la muestra se genere aleatoriamente en todos los aspectos: solo necesitamos que sea aleatoria con respecto al fenómeno de interés psicológicamente relevante. Supongamos que estoy haciendo un estudio mirando a la capacidad de la memoria de trabajo. En el estudio 1, en realidad tengo la capacidad de tomar muestras al azar de todos los seres humanos actualmente vivos, con una excepción: solo puedo muestrear personas nacidas un lunes. En el estudio 2, puedo muestrear aleatoriamente de la población australiana. Quiero generalizar mis resultados a la población de todos los humanos vivos. ¿Qué estudio es mejor? La respuesta, obviamente, es estudio 1. ¿Por qué? Porque no tenemos razón para pensar que ser “nacido un lunes” tiene alguna relación interesante con la capacidad de memoria de trabajo. En contraste, puedo pensar en varias razones por las que “ser australiano” podría importar. Australia es un país rico e industrializado con un sistema educativo muy bien desarrollado. Las personas que crecen en ese sistema habrán tenido experiencias de vida mucho más similares a las experiencias de las personas que diseñaron las pruebas de capacidad de memoria de trabajo. Esta experiencia compartida podría traducirse fácilmente en creencias similares sobre cómo “tomar una prueba”, una suposición compartida sobre cómo funciona la experimentación psicológica, etc. Estas cosas podrían realmente importar. Por ejemplo, el estilo de “toma de pruebas” podría haber enseñado a los participantes australianos cómo dirigir su atención exclusivamente en materiales de prueba bastante abstractos en relación con personas que no han crecido en un entorno similar; lo que lleva a una imagen engañosa de lo que es la capacidad de la memoria de trabajo.

Hay dos puntos ocultos en esta discusión. En primer lugar, a la hora de diseñar tus propios estudios, es importante pensar en qué población te importa, y esforzarte por muestrear de una manera que sea apropiada para esa población. En la práctica, generalmente te ves obligado a aguantar una “muestra de conveniencia” (por ejemplo, profesores de psicología prueban estudiantes de psicología porque esa es la forma menos costosa de recopilar datos, y nuestras arcas no están desbordadas exactamente de oro), pero si es así, al menos deberías pasar algún tiempo pensando en lo que peligros de esta práctica podrían ser.

En segundo lugar, si vas a criticar el estudio de otra persona porque ha utilizado una muestra de conveniencia en lugar de muestrear laboriosamente aleatoriamente de toda la población humana, al menos ten la cortesía de ofrecer una teoría específica sobre cómo esto podría haber distorsionado los resultados. Recuerden, todos en la ciencia son conscientes de este tema, y hacen lo que pueden para aliviarlo. El mero hecho de señalar que “el estudio solo incluyó a personas del grupo BLAH” es totalmente inútil, y raya en ser insultantes para los investigadores, quienes están al tanto del tema. Simplemente no pasan a estar en posesión del suministro infinito de tiempo y dinero requerido para construir la muestra perfecta. En definitiva, si se quiere ofrecer una crítica responsable del proceso de muestreo, entonces sea útil. No es útil repetir los truismos ciegamente obvios sobre los que he estado divagando en esta sección.

Parámetros poblacionales y estadísticas muestrales

Bien. Dejando de lado las espinosas cuestiones metodológicas asociadas con la obtención de una muestra aleatoria, consideremos un tema ligeramente diferente. Hasta este punto hemos estado hablando de poblaciones como podría ser un científico. Para un psicólogo, una población podría ser un grupo de personas. Para un ecologista, una población podría ser un grupo de osos. En la mayoría de los casos las poblaciones que les importan a los científicos son cosas concretas que realmente existen en el mundo real.

Los estadísticos, sin embargo, son muy graciosos. Por un lado, les interesan los datos del mundo real y la ciencia real de la misma manera que lo están los científicos. Por otro lado, también operan en el ámbito de la abstracción pura en la forma en que lo hacen los matemáticos. Como consecuencia, la teoría estadística tiende a ser un poco abstracta en cómo se define una población. De la misma manera que los investigadores psicológicos operacionalizan nuestras ideas teóricas abstractas en términos de mediciones concretas, los estadísticos operacionalizan el concepto de una “población” en términos de objetos matemáticos con los que saben trabajar. Ya te has encontrado con estos objetos que se llaman distribuciones de probabilidad (recuerda, el lugar de donde provienen los datos).

La idea es bastante sencilla. Digamos que estamos hablando de puntajes de CI. Para un psicólogo, la población de interés es un grupo de humanos reales que tienen puntajes de coeficiente intelectual. Un estadístico “simplifica” esto definiendo operacionalmente a la población como la distribución de probabilidad representada en la Figura\(\PageIndex{4}a\).

Distribución poblacional de puntajes de CI. — Figura\(\PageIndex{4}\): Distribución poblacional de los puntajes de CI (panel a) y dos muestras extraídas aleatoriamente del mismo. En el panel b tenemos una muestra de 100 observaciones, y en el panel c tenemos una muestra de 10,000 observaciones.

Las pruebas de CI están diseñadas para que el coeficiente intelectual promedio sea de 100, la desviación estándar de las puntuaciones de CI sea de 15 y la distribución de las puntuaciones de CI sea normal. Estos valores son referidos como los parámetros poblacionales porque son características de toda la población. Es decir, decimos que la media poblacional\(\mu\) es de 100, y la desviación estándar poblacional\(\sigma\) es de 15.

Ahora supongamos que recogemos algunos datos. Seleccionamos 100 personas al azar y administramos una prueba de CI, dando una muestra aleatoria simple de la población. La muestra consistiría en una colección de números como este:

106 101 98 80 74... 107 72 100

Cada una de estas puntuaciones de CI se muestrea a partir de una distribución normal con media 100 y desviación estándar 15. Entonces, si grafico un histograma de la muestra, obtengo algo como el que se muestra en la Figura\(\PageIndex{4}b\). Como puede ver, el histograma es aproximadamente la forma correcta, pero es una aproximación muy cruda a la verdadera distribución poblacional que se muestra en la Figura\(\PageIndex{4}c\). La media de la muestra es bastante cercana a la media poblacional 100 pero no idéntica. En este caso, resulta que las personas de la muestra tienen un coeficiente intelectual medio de 98.5, y la desviación estándar de sus puntajes de CI es de 15.9. Estas estadísticas muestrales son propiedades del conjunto de datos, y aunque son bastante similares a los verdaderos valores poblacionales, no son los mismos. En general, las estadísticas de muestra son las cosas que puedes calcular a partir de tu conjunto de datos, y los parámetros de población son las cosas que quieres aprender. Más adelante en este capítulo hablaremos sobre cómo puedes estimar los parámetros de población usando tus estadísticas de muestra y cómo averiguar qué tan seguro estás en tus estimaciones pero antes de llegar a eso hay algunas ideas más en la teoría del muestreo que necesitas conocer.

Search

Text Color

Text Size

Margin Size

Font Type