7.4: Realización de encuestas

Última actualización
Guardar como PDF

Page ID: 144689

Rajiv S. Jhangiani, I-Chant A. Chiang, Carrie Cuttler, & Dana C. Leighton
Kwantlen Polytechnic U., Washington State U., & Texas A&M U.—Texarkana

\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

Objetivos de aprendizaje

Explicar la diferencia entre muestreo probabilístico y no probabilístico y describir los principales tipos de muestreo probabilístico
Definir sesgo de muestreo en general y sesgo de no respuesta en particular. Enumere algunas técnicas que pueden usarse para aumentar la tasa de respuesta y reducir el sesgo de no respuesta.
Enumere las cuatro formas principales de realizar una encuesta junto con algunos pros y contras de cada una.

En esta sección, consideramos cómo realizar una encuesta. Primero consideramos el tema del muestreo, seguido de algunos métodos diferentes de recolección efectiva de datos de encuestas.

Muestreo

Esencialmente, toda la investigación psicológica implica muestrear, seleccionar una muestra para estudiar de la población de interés. El muestreo se divide en dos amplias categorías. La primera categoría, Muestreo probabilístico, ocurre cuando el investigador puede especificar la probabilidad de que cada miembro de la población sea seleccionado para la muestra. El segundo es el muestreo no probabilístico, que ocurre cuando el investigador no puede especificar estas probabilidades. La mayor parte de las investigaciones psicológicas implican muestreo no probab Por ejemplo, el muestreo de conveniencia —estudiar individuos que están cerca y dispuestos a participar— es una forma muy común de muestreo no probabilístico utilizado en la investigación psicológica. Otras formas de muestreo no probabilístico incluyen el muestreo de bolas de nieve (en el que los participantes de la investigación existentes ayudan a reclutar participantes adicionales para el estudio), muestreo de cuotas (en el que se reclutan subgrupos de la muestra para que sean proporcionales a aquellos subgrupos en población), y muestreo de autoselección (en el que los individuos eligen participar en la investigación por su propia cuenta, sin ser abordados por el investigador directamente).

Sin embargo, es mucho más probable que los investigadores de encuestas utilicen algún tipo de muestreo probabilístico. Esta tendencia se debe a que el objetivo de la mayoría de las investigaciones de encuestas es hacer estimaciones precisas sobre lo que es cierto en una población en particular, y estas estimaciones son más precisas cuando se basan en una muestra probabilística. Por ejemplo, es importante que los investigadores de encuestas basen sus estimaciones de los resultados electorales, que a menudo se deciden por solo unos pocos puntos porcentuales, en muestras de probabilidad de votantes probablemente registrados.

En comparación con el muestreo no probabilístico, el muestreo probabilístico requiere una especificación muy clara de la población, lo que por supuesto depende de las preguntas de investigación a responder. La población podría ser todos votantes registrados en el estado de Washington, todos los consumidores estadounidenses que han comprado un automóvil en el último año, mujeres en Seattle mayores de 40 años que han recibido una mamografía en la última década, o todos los ex alumnos de una universidad en particular. Una vez especificada la población, el muestreo probabilístico requiere un marco de muestreo. Este marco de muestreo es esencialmente una lista de todos los miembros de la población a partir de la cual seleccionar a los encuestados. Los marcos de muestreo pueden provenir de una variedad de fuentes, incluyendo directorios telefónicos, listas de votantes registrados y registros de hospitales o seguros. En algunos casos, un mapa puede servir como marco de muestreo, permitiendo la selección de ciudades, calles o hogares.

Hay una variedad de diferentes métodos de muestreo probabilístico. El muestreo aleatorio simple se realiza de tal manera que cada individuo de la población tiene la misma probabilidad de ser seleccionado para la muestra. Este tipo de muestreo podría implicar poner los nombres de todos los individuos en el marco de muestreo en un sombrero, mezclarlos y luego extraer el número necesario para la muestra. Dado que la mayoría de los marcos de muestreo toman la forma de archivos informáticos, es más probable que el muestreo aleatorio implique la clasificación computarizada o la selección de los encuestados. Un enfoque común en las encuestas telefónicas es la marcación de dígitos aleatorios, en la que una computadora genera aleatoriamente números de teléfono de entre los posibles números de teléfono dentro de un área geográfica determinada.

Una alternativa común al muestreo aleatorio simple es el muestreo aleatorio estratificado, en el que la población se divide en diferentes subgrupos o “estratos” (generalmente con base en características demográficas) y luego se toma una muestra aleatoria de cada “estrato”. El muestreo aleatorio estratificado proporcional se puede utilizar para seleccionar una muestra en la que la proporción de encuestados en cada uno de los diversos subgrupos coincide con la proporción en la población. Por ejemplo, debido a que alrededor del 12.6% de la población estadounidense es afroamericana, se puede utilizar un muestreo aleatorio estratificado para asegurar que una encuesta de 1,000 adultos estadounidenses incluya aproximadamente 126 encuestados afroamericanos. El muestreo aleatorio estratificado desproporcionado también se puede utilizar para muestrear encuestados adicionales de subgrupos particularmente pequeños, lo que permite sacar conclusiones válidas sobre esos subgrupos. Por ejemplo, debido a que los estadounidenses de origen asiático constituyen un porcentaje relativamente pequeño de la población estadounidense (aproximadamente 5.6%), una simple muestra aleatoria de 1,000 adultos estadounidenses podría incluir muy pocos Asiático-americanos para sacar conclusiones sobre ellos como distintos de cualquier otro subgrupo. Sin embargo, si la representación es importante para la pregunta de investigación, entonces se podría utilizar un muestreo aleatorio estratificado desproporcionado para garantizar que se incluyan suficientes encuestados asiático-americanos en la muestra para sacar conclusiones válidas sobre el conjunto asiático-americano.

Otro tipo de muestreo probabilístico es el muestreo por conglomerados, en el que se muestrean aleatoriamente grupos más grandes de individuos y luego se muestrean aleatoriamente individuos dentro de cada grupo. Este es el único método de muestreo probabilístico que no requiere una trama de muestreo. Por ejemplo, para seleccionar una muestra de residentes de pueblos pequeños en Washington, un investigador podría seleccionar aleatoriamente varios pueblos pequeños y luego seleccionar aleatoriamente varios individuos dentro de cada pueblo. El muestreo por conglomerados es especialmente útil para encuestas que involucran entrevistas cara a cara porque minimiza la cantidad de viajes que deben realizar los entrevistadores. Por ejemplo, en lugar de viajar a 200 pueblos pequeños para entrevistar a 200 residentes, un equipo de investigación podría viajar a 10 pueblos pequeños y entrevistar a 20 residentes de cada uno. La Encuesta Nacional de Comorbilidad se realizó utilizando una forma de muestreo por conglomerados.

¿Qué tan grande debe ser una muestra de encuesta? En general, esta estimación depende de dos factores. Uno es el nivel de confianza en el resultado que quiere el investigador. Cuanto mayor sea la muestra, más cerca tenderá a estar cualquier estadística basada en esa muestra del valor correspondiente en la población. El otro factor es una restricción práctica en la forma del presupuesto del estudio. Las muestras más grandes proporcionan mayor confianza, pero requieren más tiempo, esfuerzo y dinero para obtenerlas. Teniendo en cuenta estos dos factores, la mayoría de las investigaciones de encuestas utilizan tamaños de muestra que oscilan entre aproximadamente 100 y aproximadamente 1,000. Realizar un análisis de potencia previo al lanzamiento de la encuesta ayuda a guiar al investigador en la realización de esta compensación.

Tamaño de la muestra y tamaño de la población

¿Por qué una muestra de alrededor de 1,000 se considera adecuada para la mayoría de las investigaciones de encuestas, incluso cuando la población es mucho mayor que esa? Considere, por ejemplo, que una muestra de solo 1,000 adultos estadounidenses generalmente se considera una buena muestra de los aproximadamente 252 millones de adultos en la población estadounidense, ¡aunque incluye solo alrededor de 0.000004% de la población! La respuesta es un poco sorprendente.

Una parte de la respuesta es que una estadística basada en una muestra más grande tenderá a estar más cerca del valor poblacional y que este se pueda caracterizar matemáticamente. Imagínese, por ejemplo, que en una muestra de votantes registrados, exactamente el 50% dice que pretende votar por el titular. Si hay 100 electores en esta muestra, entonces hay un 95% de probabilidades de que el verdadero porcentaje en la población esté entre 40 y 60. Pero si hay mil electores en la muestra, entonces hay un 95% de posibilidades de que el verdadero porcentaje en la población esté entre 47 y 53. Aunque este “intervalo de confianza del 95%” continúa reduciéndose a medida que aumenta el tamaño de la muestra, lo hace a un ritmo más lento. Por ejemplo, si hay 2 mil electores en la muestra, entonces esta reducción sólo reduce el intervalo de confianza del 95% a 48 a 52. En muchas situaciones, el pequeño aumento de confianza más allá de un tamaño de muestra de 1,000 no se considera que valga la pena el tiempo, el esfuerzo y el dinero adicionales.

Otra parte de la respuesta —y quizás la parte más sorprendente— es que los intervalos de confianza dependen únicamente del tamaño de la muestra y no del tamaño de la población. Por lo que una muestra de mil produciría un intervalo de confianza del 95% de 47 a 53 independientemente de que el tamaño de la población fuera de cien mil, un millón, o cien millones.

Sesgo de muestreo

El muestreo probabilístico se desarrolló en gran parte para abordar el tema del sesgo de muestreo. El sesgo de muestreo ocurre cuando se selecciona una muestra de tal manera que no es representativa de toda la población y por lo tanto produce resultados inexactos. Este sesgo fue la razón por la que el sondeo de paja de la Recopilación Literaria estaba tan lejos en su predicción de las elecciones presidenciales de 1936. Las listas de correo utilizadas provinieron en gran parte de directorios telefónicos y listas de propietarios de automóviles registrados, que sobrerrepresentaban a personas más ricas, que tenían más probabilidades de votar por Landon. Gallup tuvo éxito porque conocía este sesgo y también encontró formas de probar a personas menos ricas.

Hay una forma de sesgo de muestreo a la que se somete incluso el muestreo aleatorio cuidadoso. Casi nunca es el caso de que todos los seleccionados para la muestra realmente respondan a la encuesta. Algunos pueden haber muerto o haberse mudado, y otros pueden negarse a participar porque están demasiado ocupados, no están interesados en el tema de la encuesta, o no participan en encuestas de principio. Si estos no respondedores de encuestas difieren de los respondedores de encuestas de manera sistemática, entonces esta diferencia puede producir sesgos de no respuesta. Por ejemplo, en una encuesta por correo sobre consumo de alcohol, la investigadora Vivienne Lahaut y sus colegas encontraron que solo alrededor de la mitad de la muestra respondió después del contacto inicial y dos recordatorios de seguimiento (Lahaut, Jansen, van de Mheen, & Garretsen, 2002) ^[1]. El peligro aquí es que la mitad que respondió podría tener diferentes patrones de consumo de alcohol que la mitad que no lo hizo, lo que podría llevar a conclusiones inexactas por parte de los investigadores. Entonces, para probar el sesgo de falta de respuesta, los investigadores realizaron posteriormente visitas sin previo aviso a los hogares de un subconjunto de los no respondedores, volviendo a cinco veces si no los encontraban en casa. Encontraron que los no respondedores originales incluían una proporción especialmente alta de abstenciones (no bebedores), lo que significaba que sus estimaciones de consumo de alcohol basadas únicamente en los respondedores originales eran demasiado altas.

Aunque existen métodos para corregir estadísticamente el sesgo de falta de respuesta, se basan en suposiciones sobre los no respondedores, por ejemplo, que son más similares a los respondedores tardíos que a los respondedores tempranos, lo que puede no ser correcto. Por esta razón, el mejor enfoque para minimizar el sesgo de falta de respuesta es minimizar el número de no respondedores, es decir, maximizar la tasa de respuesta. Existe una gran literatura de investigación sobre los factores que afectan las tasas de respuesta a encuestas (Groves et al., 2004) ^[2]. En general, las entrevistas presenciales tienen las tasas de respuesta más altas, seguidas de encuestas telefónicas, y luego encuestas por correo e Internet. Entre los otros factores que aumentan las tasas de respuesta están enviar a los posibles encuestados un breve mensaje previo a la notificación informándoles que se les pedirá que participen en una encuesta en un futuro próximo y enviar recordatorios simples de seguimiento a los que no respondan después de algunas semanas. La duración y complejidad percibidas de la encuesta también pueden marcar la diferencia, por lo que es importante mantener los cuestionarios de la encuesta lo más cortos, simples y sobre el tema como sea posible. Por último, ofrecer un incentivo—especialmente efectivo— es una manera confiable de aumentar las tasas de respuesta. No obstante, éticamente, existen límites para ofrecer incentivos que pueden ser tan grandes como para ser considerados coercitivos.

Realización de la Encuesta

Las cuatro formas principales de realizar encuestas son a través de entrevistas en persona, por teléfono, por correo y por internet. Al igual que con otros aspectos del diseño de encuestas, la elección depende tanto de los objetivos del investigador como del presupuesto. Las entrevistas en persona tienen las tasas de respuesta más altas y proporcionan el contacto personal más cercano con los encuestados. El contacto personal puede ser importante, por ejemplo, cuando el entrevistador debe ver y emitir juicios sobre los encuestados, como es el caso de algunas entrevistas de salud mental. Pero las entrevistas en persona son, con mucho, el enfoque más costoso. Las encuestas telefónicas tienen tasas de respuesta más bajas y aún proporcionan algún contacto personal con los encuestados. También pueden ser costosas pero generalmente lo son menos que las entrevistas en persona. Tradicionalmente, los directorios telefónicos han proporcionado tramas de muestreo bastante completas. No obstante, esta tendencia es menos cierta hoy en día ya que más personas optan por tener solo celulares y no instalan líneas fijas que estarían incluidas en los directorios telefónicos. Las encuestas por correo son aún menos costosas pero generalmente tienen tasas de respuesta aún más bajas, lo que las hace más susceptibles al sesgo de no respuesta.

No es sorprendente que las encuestas en Internet sean cada vez más comunes. Son cada vez más fáciles de construir y usar (ver “Creación de encuestas en línea”). Si bien el contacto inicial se puede hacer por correo con un enlace proporcionado a la encuesta, este enfoque no necesariamente produce mayores tasas de respuesta que una encuesta postal ordinaria. Un mejor enfoque es hacer contacto inicial por correo electrónico con un enlace directo a la encuesta. Este enfoque puede funcionar bien cuando la población está formada por miembros de una organización que tienen direcciones de correo electrónico conocidas y las utilizan regularmente (por ejemplo, una comunidad universitaria). Para otras poblaciones, puede ser difícil o imposible encontrar una lista completa de direcciones de correo electrónico para que sirvan como marco de muestreo. Alternativamente, una solicitud para participar en la encuesta con un enlace a la misma puede ser publicada en sitios conocidos por ser visitados por miembros de la población. Pero nuevamente es muy difícil conseguir algo que se acerque a una muestra aleatoria de esta manera porque es probable que los miembros de la población que visitan los sitios web sean diferentes de la población en su conjunto. Sin embargo, los métodos de encuestas por Internet están en rápido desarrollo. Debido a su bajo costo, y debido a que hay más personas en línea que nunca, es probable que las encuestas en Internet se conviertan en el enfoque dominante para la recopilación de datos de encuestas en un futuro próximo.

Por último, es importante señalar que algunas de las preocupaciones que tienen las personas sobre la recolección de datos en línea (por ejemplo, que los hallazgos basados en Internet difieren de los obtenidos con otros métodos) han resultado ser mitos. Figura\(\PageIndex{1}\) (adaptada de Gosling, Vazire, Srivastava, & John, 2004) ^[3] aborda tres ideas preconcebidas sobre los datos recopilados en estudios basados en la web:

Figura\(\PageIndex{1}\): Algunas ideas preconcebidas y hallazgos relacionados con estudios basados en la web
Preconcepción	Encontrar
Las muestras de Internet no son demográficamente diversas	Las muestras de Internet son más diversas que las muestras tradicionales en muchos dominios, aunque no son completamente representativas de la población
Las muestras de Internet están inajustadas, socialmente aisladas o deprimidas	Los usuarios de Internet no difieren de los no usuarios en marcadores de ajuste y depresión
Los hallazgos basados en Internet difieren de los obtenidos con otros métodos	La evidencia hasta ahora sugiere que los hallazgos basados en Internet son consistentes con los hallazgos basados en métodos tradicionales (por ejemplo, en autoestima, personalidad), pero se necesitan más datos.

Creación de encuestas en línea

Ahora hay varias herramientas en línea para crear cuestionarios en línea. Después de crear un cuestionario, un enlace a él puede ser enviado por correo electrónico a los posibles encuestados o incrustado en una página web. Los siguientes sitios web se encuentran entre los que ofrecen cuentas gratuitas. Aunque las cuentas gratuitas limitan el número de ítems del cuestionario y el número de encuestados, pueden ser útiles para hacer encuestas a pequeña escala y para practicar los principios de una buena construcción de cuestionarios. Aquí hay algunas herramientas de encuestas en línea de uso común:

SurveyMonkey— https://surveymonkey.com
PsyToolkit— https://www.psytoolkit.org/ (gratis, no comercial, y hace muchos paradigmas experimentales)
Cualtrics— https://www.qualtrics.com/
PsyCData— https://www.psychdata.com/

Una pequeña nota de precaución: los datos del software de encuestas estadounidenses se mantienen en servidores estadounidenses, y están sujetos a ser incautados según lo otorgado a través de la Ley Patriota. Para evitar infringir cualquier derecho, la siguiente es una lista de sitios de encuestas en línea que están alojados en Canadá:

Encuestas de Fluidos— http://fluidsurveys.com/
Encuesta Simple— http://www.simplesurvey.com/
Encuesta de cal— https://www.limesurvey.org

También hay sitios de encuestas alojados en otros países fuera de Norteamérica.

Otra nueva herramienta para investigadores de encuestas es Mechanical Turk (MTurk) creada por Amazon.com https://www.mturk.com Originalmente creada para pruebas de usabilidad simples, MTurk tiene una base de datos de más de 500,000 trabajadores de más de 190 países ^[4]. Puedes poner tareas simples (por ejemplo, redacción de preguntas diferentes para probar los ítems de tu encuesta), establecer parámetros según dicte tu marco de muestra e implementar tu experimento a un costo muy bajo (por ejemplo, unos centavos por menos de 5 minutos). MTurk ha sido alabado como una forma económica de recopilar datos de alta calidad (Buhrmester, Kwang, & Gosling, 2011) ^[5].

Referencias

Lahaut, V. M. H. C. J., Jansen, H. A. M., van de Mheen, D., & Garretsen, H. F. L. (2002). Sesgo de no respuesta en una encuesta muestral sobre consumo de alcohol. Alcohol y Alcoholismo, 37, 256—260.
Groves, R. M., Fowler, F. J., Couper, M. P., Lepkowski, J. M., Singer, E., & Tourangeau, R. (2004). Metodología de encuestas. Hoboken, NJ: Wiley.
Gosling, S. D., Vazire, S., Srivastava, S., & John, O. P. (2004). ¿Debemos confiar en los estudios basados en web? Un análisis comparativo de seis ideas preconcebidas sobre cuestionarios de internet. Psicólogo Americano, 59 (2), 93-104.
Natala @aws. (2011, 26 de enero). Re: Censo de MTurk: ¿Acerca de cuántos trabajadores estaban en Mechanical Turk en 2010? Mensaje publicado en los foros de discusión de Amazon Web Services. Recuperado a partir de [1]https://forums.aws.amazon.com/thread.jspa?threadID=58891
Buhrmester, M., Kwang, T., & Gosling, S.D. (2011). Mechanical Turk de Amazon: ¿una nueva fuente de datos económicos pero de alta calidad? Perspectivas sobre la Ciencia Psicológica, 6 (1), 3-5.