Saltar al contenido principal
LibreTexts Español

14.4: Análisis de datos secundarios

  • Page ID
    144936
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    \( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)

    ( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\id}{\mathrm{id}}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\kernel}{\mathrm{null}\,}\)

    \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\)

    \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\)

    \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    \( \newcommand{\vectorA}[1]{\vec{#1}}      % arrow\)

    \( \newcommand{\vectorAt}[1]{\vec{\text{#1}}}      % arrow\)

    \( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vectorC}[1]{\textbf{#1}} \)

    \( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)

    \( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)

    \( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)

    \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    Objetivos de aprendizaje

    • Definir análisis de datos secundarios
    • Enumerar las fortalezas y limitaciones del análisis de datos secundarios
    • Nombrar al menos dos fuentes de datos cuantitativos disponibles públicamente
    • Nombrar al menos dos fuentes de datos cualitativos disponibles públicamente

    Una ventaja de la investigación discreta es que es posible que pueda omitir la fase de recopilación de datos por completo. Para muchos, saltarse la fase de recolección de datos es preferible ya que permite al investigador proceder directamente a responder a su pregunta a través del análisis de datos. Cuando los investigadores analizan datos recopilados originalmente por otra persona o entidad, realizan análisis secundarios de datos. Los investigadores obtienen acceso a los datos recopilados por otros investigadores, agencias gubernamentales y otras fuentes únicas al establecer conexiones con personas dedicadas a la investigación primaria o acceder a sus datos a través de fuentes disponibles públicamente.

    Imagina que querías estudiar si la raza o el género influyeron en lo que las personas principales eligieron en tu universidad. Podrías hacer tu mejor esfuerzo para distribuir una encuesta a una muestra representativa de estudiantes, pero quizás una mejor idea sería pedirle esta información a tu registrador universitario. Tu colegio ya recopila esta información de todos sus alumnos. ¿No sería mejor simplemente pedir acceso a esta información, en lugar de recopilarla usted mismo? Tal vez.

    Desafíos en el análisis de datos secundarios

    Algunos de ustedes pueden estar pensando: “Nunca le di permiso a mi universidad para compartir mi información con otros investigadores”. Dependiendo de las políticas de tu universidad, esto puede o no ser cierto. En cualquier caso, los datos secundarios suelen ser anonimizados o no contienen información identificativa. En nuestro ejemplo, los nombres de los estudiantes, los números de identificación de los estudiantes, las ciudades de origen y otros datos de identificación no se compartirían con un investigador secundario. En cambio, solo se compartiría la información sobre las variables —raza, género y mayor—. Las técnicas de anonimización no son infalibles, y esto es un desafío para el análisis secundario de datos. Con base en mi limitada muestra de aulas de trabajo social que he enseñado, generalmente solo hay dos o tres hombres en la sala. Si bien la privacidad puede no ser un gran problema para un estudio sobre la elección de especialización, imagine si nuestro estudio de ejemplo incluyó calificaciones finales, ingresos o si sus padres asistieron a la universidad. Si yo fuera investigador usando datos secundarios, probablemente podría averiguar qué datos pertenecían a qué hombres porque hay muy pocos hombres en la mayor. Esto también es un problema en la investigación del mundo real. Los datos anonimizados de compañías de tarjetas de crédito, Netflix, AOL y empresas de publicidad en línea han sido “desenmascarados”, lo que permite a los investigadores identificar a casi todas las personas en un conjunto de datos (Bode, K. 2017; de Montjoy, Radaelli, Singh, & Pentland, 2015) [1]

    Otro desafío con los datos secundarios se debe a la falta de control sobre el proceso de recolección de datos. Quizás tu universidad cometió un error en sus formularios o ingresó datos incorrectamente. Si estos fueran tus datos, ciertamente nunca cometerías tal error. Pero si sucediera, podrías corregirlo enseguida. Con los datos secundarios, es menos capaz de corregir cualquier error cometido por la fuente original durante la recolección de datos. Más importante aún, es posible que no sepas que estos errores existen y llegar a conclusiones erróneas como resultado. Los investigadores que utilicen datos secundarios deben evaluar los procedimientos utilizados para recopilar los datos siempre que sea posible, y los datos que carecen de documentación sobre los procedimientos deben tratarse con precaución.

    También es importante atender cómo los investigadores originales trataron los datos faltantes o incompletos. Es posible que los investigadores simplemente hayan utilizado la puntuación media para una pieza de datos faltantes o los hayan excluido del análisis por completo. Los investigadores primarios tomaron esa decisión por una razón, y los investigadores secundarios deben entender su proceso de toma de decisiones antes de proceder con el análisis. Por último, los investigadores secundarios deben tener acceso al libro de códigos para datos cuantitativos y al esquema de codificación para datos cualitativos. Un conjunto de datos cuantitativo a menudo contiene una taquigrafía para números de preguntas, variables y atributos. Un análisis cualitativo de datos contiene como esquema de codificación que explica definiciones y relaciones para todos los códigos. Sin estos, los datos serían difíciles de comprender para un investigador secundario.

    Los investigadores secundarios, particularmente los que realizan investigaciones cuantitativas, también deben garantizar que su conceptualización y operacionalización de variables coincida con la de los investigadores primarios. Si su análisis secundario se centra en una variable que no era una parte importante del análisis original, es posible que no tenga suficiente información sobre esa variable para realizar un análisis exhaustivo. Por ejemplo, si querías estudiar si la depresión está asociada con ingresos para estudiantes y encontraste un conjunto de datos que incluyera esas variables. Si la depresión no fue un foco del conjunto de datos, es posible que los investigadores solo hayan incluido una pregunta como: “¿Alguna vez te han diagnosticado un trastorno depresivo mayor?” Si bien las respuestas a esta pregunta te darán alguna información sobre la depresión, no te dará la profundidad que una escala como el Inventario de Depresión de Beck's o la Escala de Calificación de Hamilton para la Depresión haría o proporcionaría información sobre la gravedad de los síntomas como hospitalización o intentos de suicidio. Sin este nivel de profundidad, su análisis puede carecer de validez. Incluso cuando la operacionalización de tus variables de interés es exhaustiva, los investigadores pueden conceptualizar variables de manera diferente a la tuya. Quizás les interese si una persona fue diagnosticada con depresión en su vida, mientras que, a usted le preocupan los síntomas actuales de depresión. Por estas razones, la lectura de informes de investigación y otra documentación es un requisito para el análisis secundario de datos.

    La falta de control sobre el proceso de recolección de datos también obstaculiza el proceso de investigación en sí. Si bien algunos estudios se crean perfectamente, la mayoría se refinan a través de pruebas piloto y retroalimentación antes de realizar el estudio completo (Engel & Schutt, 2016). [2] El análisis secundario de datos no le permite participar en este proceso. Para los investigadores cualitativos en particular, este es un reto importante. La investigación cualitativa, particularmente desde el paradigma interpretivista, utiliza procesos emergentes en los que las preguntas de investigación, la conceptualización de términos y las medidas se desarrollan y cambian a lo largo del estudio. El análisis secundario de datos impide que este proceso se lleve a cabo debido a que los datos ya están recopilados. Debido a que los métodos cualitativos a menudo implican analizar el contexto en el que se recopilan los datos, es posible que los investigadores secundarios no sepan lo suficiente como para representar de manera auténtica y precisa los datos originales en un nuevo análisis.

    Volviendo a nuestro ejemplo sobre raza, género y mayor una vez más, supongamos que está razonablemente seguro de que los datos no contienen errores y se siente cómodo con no tener control sobre el proceso de recopilación de datos. Obtener acceso a los datos no es tan sencillo como entrar a la oficina del registrador con una sonrisa. Los investigadores que busquen acceder a datos recabados por universidades (u hospitales, aseguradoras de salud, agencias de servicios humanos, etc.) deben contar con el apoyo de la administración. En algunos casos, es posible que un investigador solo tenga que demostrar que es competente para completar el análisis, compartir su plan de análisis de datos y recibir la aprobación ética de un IRB. Los administradores de datos a los que suelen acceder los investigadores, como los datos de Medicaid o del Censo, pueden entrar en esta categoría.

    Es posible que la administración de su escuela no esté acostumbrada a asociarse con investigadores para analizar a sus alumnos. De hecho, los administradores pueden ser bastante sensibles a cómo se percibe su escuela como resultado de tu estudio. Si tu estudio encontrara que las mujeres o los latinos están excluidos de las carreras de ingeniería y ciencias, eso se reflejaría mal en la universidad y la administración. Puede ser importante que los investigadores formen una asociación con la agencia o universidad cuyos datos estén incluidos en el análisis secundario de datos. Los administradores confiarán en las personas que perciben como competentes, de buena reputación y objetivas. Deben confiar en ti para dedicarte a una investigación rigurosa y concienzuda. Un investigador de mala reputación puede buscar elevar su reputación encontrando resultados impactantes (reales o falsos) en los datos de tu universidad, mientras daña la reputación de la universidad.

    Por otro lado, si tu análisis secundario de datos pinta a la universidad con una luz brillante y rosada, otros investigadores pueden ser escépticos de tus hallazgos. Este problema preocupó a Steven Levitt, un economista que trabajó con Uber para estimar cuánto ahorraron los consumidores al usar su servicio frente a los taxis tradicionales. Levitt sabía que tendría que asociarse con Uber para poder acceder a sus datos pero tuvo cuidado de obtener un permiso por escrito para publicar sus resultados, independientemente de que sus resultados fueran positivos o negativos para Uber (Huggins, 2016). [3] Los investigadores que utilizan datos secundarios deben tener cuidado de generar confianza con los guardianes en la administración sin comprometer su objetividad a través de conflictos de interés.

    Fortalezas del análisis de datos secundarios

    Si bien los desafíos asociados con el análisis de datos secundarios son importantes, las fortalezas del análisis de datos secundarios a menudo superan estas limitaciones. Lo más importante es que el análisis de datos secundarios es más rápido y económico que un estudio tradicional porque los datos ya están recopilados. Una vez que un investigador obtiene acceso a los datos, es simplemente cuestión de analizarlos y redactar los resultados para completar el proyecto. Los datos pueden tardar mucho en recopilarse y ser bastante intensivos en recursos. Entonces, evitar este paso es una fortaleza significativa del análisis de datos secundarios. Si los investigadores primarios tuvieran acceso a más recursos, también podrían participar en la recolección de datos que es más rigurosa de lo que podría hacer un investigador secundario. De esta manera, externalizar la recolección de datos a alguien con más recursos puede hacer que tu diseño sea más fuerte, no más débil. Por último, los investigadores secundarios hacen nuevas preguntas que los investigadores primarios quizás no hayan considerado. De esta manera, el análisis de datos secundarios profundiza nuestra comprensión de los datos existentes en el campo.

    El análisis secundario de datos también proporciona a los investigadores acceso a datos que de otro modo no estarían disponibles o desconocidos para el público. Un buen ejemplo de ello es la investigación histórica, en la que los investigadores analizan datos de fuentes primarias de eventos y procedimientos históricos. Netting y O'Connor (2016) [4] estaban interesados en comprender qué impacto tuvieron las organizaciones religiosas en el desarrollo de los servicios humanos en Richmond, Virginia. Utilizando documentos del Valentine History Center, Virginia Historical Society y otras fuentes, los investigadores pudieron descubrir los orígenes del bienestar social en la ciudad: los programas de asistencia al viajero en la década de 1700. En su estudio, también descubrieron el importante papel que desempeñaban las mujeres en las agencias de bienestar social, un hallazgo sorprendente dada la privación histórica de derechos de las mujeres en la sociedad estadounidense. El análisis secundario de datos brinda al investigador la oportunidad de responder preguntas como estas sin una máquina del tiempo. El Cuadro 14.3 resume las fortalezas y limitaciones de los datos existentes.

    Tabla 14.3 Fortalezas y limitaciones de los datos existentes
    Fortalezas Limitaciones
    Reduce el tiempo necesario para completar el proyecto Los datos anónimos pueden no ser realmente anónimos
    Más barato de llevar a cabo, en muchos casos Sin control sobre el proceso de recolección de datos
    Investigador primario puede tener más recursos para llevar a cabo una recopilación rigurosa de datos que usted No se pueden refinar preguntas, medidas o procedimientos basados en comentarios o pruebas piloto
    Nos ayuda a profundizar en nuestra comprensión de los datos que ya están en la literatura Puede operacionalizar o conceptualizar conceptos de manera diferente a la investigadora primaria
    Útil para la investigación histórica Falta contexto cualitativo
    Barreras de acceso y conflictos de intereses

    En última instancia, tendrá que sopesar las fortalezas y limitaciones de usar datos secundarios por su cuenta. Engel y Schutt (2016, p. 327) [5] proponen seis preguntas para hacer antes de usar datos secundarios:

    1. ¿Cuáles fueron los objetivos de la agencia o del investigador en la recolección de los datos?
    2. ¿Qué datos se recolectaron y qué se pretendía medir?
    3. ¿Cuándo se recabó la información?
    4. ¿Qué métodos se utilizaron para la recolección de datos? ¿Quién se encarga de la recolección de datos y cuáles son sus calificaciones? ¿Están disponibles para responder preguntas sobre los datos?
    5. ¿Cómo se organiza la información (por fecha, individuo, familia, evento, etc.)? ¿Hay identificadores utilizados para identificar diferentes tipos de datos disponibles?
    6. ¿Qué se sabe sobre el éxito del esfuerzo de recolección de datos? ¿Cómo se indican y tratan los datos faltantes? ¿Qué tipo de documentación está disponible? ¿Qué tan consistentes son los datos con los datos disponibles de otras fuentes?

    Fuentes de datos secundarios

    Muchas fuentes de datos cuantitativos están disponibles públicamente. La Encuesta Social General (GSS), que se discutió en el Capítulo 11, es una de las fuentes de datos disponibles públicamente más comúnmente entre los investigadores cuantitativos (http://www.norc.uchicago.edu/GSS+Website). Los datos para el GSS se han recopilado regularmente desde 1972, ofreciendo así a los investigadores sociales la oportunidad de investigar los cambios en las actitudes y creencias de los estadounidenses a lo largo del tiempo. Las preguntas sobre el SSG cubren una gama extremadamente amplia de temas, desde la vida familiar hasta las creencias políticas y religiosas y las experiencias laborales.

    Otras fuentes de datos cuantitativos incluyen Add Health (http://www.cpc.unc.edu/projects/addhealth), un estudio que se inició en 1994 para conocer las vidas y comportamientos de los adolescentes en Estados Unidos, y el Estudio Longitudinal de Wisconsin (https://www.ssc.wisc.edu/wlsresearch), un estudio que, desde hace más de 40 años, encuestó a un panel de 10,000 personas que se graduaron de las escuelas secundarias de Wisconsin en 1957. Los investigadores cuantitativos interesados en estudiar procesos sociales fuera de Estados Unidos también tienen muchas opciones cuando se trata de conjuntos de datos disponibles públicamente. Los datos del British Household Panel Study (https://www.iser.essex.ac.uk/bhps), una encuesta longitudinal y representativa de hogares en Gran Bretaña, están disponibles gratuitamente para quienes realizan investigaciones académicas (se cobra a las entidades privadas el acceso a los datos). El Programa Internacional de Encuestas Sociales (http://www.issp.org) fusiona el SGS con sus contrapartes en otros países del mundo. Estos representan solo algunas de las muchas fuentes de datos cuantitativos disponibles públicamente.

    Desafortunadamente para los investigadores cualitativos, existen muchas menos fuentes de datos cualitativos gratuitos y disponibles públicamente. Esto está cambiando lentamente, sin embargo, a medida que crece la sofisticación técnica y se vuelve más fácil digitalizar y compartir datos cualitativos. A pesar de comparativamente menos fuentes que para datos cuantitativos, todavía hay una serie de fuentes de datos disponibles para los investigadores cualitativos cuyos intereses o recursos limitan su capacidad para recopilar datos por su cuenta. El Murray Research Archive Harvard, ubicado en el Instituto de Ciencias Sociales Cuantitativas de la Universidad de Harvard, ofrece historias de casos y datos cualitativos de entrevistas (http://dvn.iq.harvard.edu/dvn/dv/mra). El proyecto Global Feminisms de la Universidad de Michigan ofrece transcripciones de entrevistas e historias orales grabadas en video enfocadas en activismo feminista; movimientos de mujeres; y estudios académicos de mujeres en China, India, Polonia y Estados Unidos. [6] En la Universidad de Connecticut, la Oficina de Historia Oral proporciona enlaces a otros sitios de historia oral (www.oralhistory.uconn.edu/links.html). No todos los enlaces ofrecen datos disponibles públicamente, pero muchos sí. Por último, la Colección Histórica del Sur de la Universidad de Carolina del Norte —Chapel Hill ofrece versiones digitales de muchos documentos primarios en línea como revistas, cartas, correspondencia y otros artículos que documentan la historia y la cultura del Sur Americano ( dc.lib.unc.edu/ead/archivalhome.php? cisoroot=/ead).

    Tenga en cuenta que los recursos aquí mencionados representan solo una instantánea de las muchas fuentes de datos disponibles públicamente a las que se puede acceder fácilmente a través de la web. En el cuadro 14.4 se resumen las fuentes de datos discutidas en esta sección.

    Cuadro 14.4 Fuentes de datos disponibles públicamente
    Hogar organizacional Foco/tema Datos Dirección web
    Centro Nacional de Investigación de Opinión Encuesta Social General; preguntas demográficas, conductuales, actitudinales y de interés especial; muestra nacional Cuantitativo http://www.norc.uchicago.edu/GSS+Website/
    Centro de Población de Carolina Agregar Salud; bienestar social, económico, psicológico y físico longitudinal de la cohorte en los grados 7—12 en 1994 Cuantitativo http://www.cpc.unc.edu/projects/addhealth
    Centro de Demografía de Salud y Envejecimiento Wisconsin Longitudinal Study; estudio del curso de vida de cohortes egresados de secundaria en 1957 Cuantitativo https://www.ssc.wisc.edu/wlsresearch/
    Instituto de Investigaciones Sociales y Económicas British Household Panel Survey; estudio longitudinal de la vida y el bienestar británicos Cuantitativo www.iser.essex.ac.uk/bhps
    Programa Internacional de Encuestas Sociales Datos internacionales similares a GSS Cuantitativo http://www.issp.org/
    El Instituto de Ciencias Sociales Cuantitativas de la Universidad de Harvard Gran archivo de datos escritos, audio y video enfocados en muchos temas Cuantitativo y cualitativo http://dvn.iq.harvard.edu/dvn/dv/mra
    Instituto de Investigaciones sobre la Mujer y el Género Proyecto Global de Feminismos; transcripciones de entrevistas e historias orales sobre feminismo y activismo femenino Cualitativo www.umich.edu/~glblfem/index.html
    Consultorio de Historia Oral Descripciones y enlaces a numerosos archivos de historia oral Cualitativo www.oralhistory.uconn.edu/links.html
    Biblioteca UNC Wilson Colección de manuscritos digitalizados de la Colección Histórica del Sur Cualitativo dc.lib.unc.edu/ead/archivalhome.php? cisoroot=/ead

    Si bien el intercambio público y gratuito de datos se ha vuelto cada vez más común a lo largo de los años, y es un requisito cada vez más común de quienes financian la investigación, los investigadores de Harvard se enteraron recientemente de los peligros potenciales de poner los datos a disposición de todos (Parry, 2011). [7] En 2008, el profesor Nicholas Christakis, Jason Kaufman, y colegas, del Berkman Center for Internet & Society de Harvard, lanzaron la primera ola de sus datos recopilados de los perfiles de 1,700 usuarios de Facebook (2008). [8] Pero poco después, los investigadores se vieron obligados a negar el acceso público a los datos después de que se descubrió que los sujetos podían identificarse fácilmente con una minuciosa extracción del conjunto de datos. Quizás solo el tiempo y la experiencia adicional dirán lo que depara el futuro para un mayor acceso a los datos recopilados por otros.

    Conclusiones clave

    • Las fortalezas y limitaciones del análisis secundario de datos deben considerarse antes de que comience un proyecto.
    • Las fuentes de datos previamente recopiladas permiten a los investigadores realizar análisis secundarios de datos.

    Glosario

    • Datos anonimizados- datos que no contienen información identificativa
    • Investigación-análisis histórico de datos de fuentes primarias de eventos y procedimientos históricos
    • Análisis de datos secundarios: analizar datos recopilados originalmente por otra persona o entidad

    Atribuciones de imagen

    anónimo por SplitShire CC-0

    archivo de Pexels CC-0


    1. Bode, K. (2017, 26 de enero). Una vez más con sentimiento: datos de usuario 'anonimizados' no realmente anónimos. Techdirt. Recuperado de: https://www.techdirt.com/articles/20170123/08125136548/one-more-time-with-feeling-anonymized-user-data-not-really-anonymous.shtml; de Montjoye, Y. A., Radaelli, L., & Singh, V. K. (2015). Único en el centro comercial: Sobre la reidentificabilidad de los metadatos de las tarjetas de crédito. Ciencia, 347 (6221), 536-539.
    2. Engel, R. J. & Schutt, R. K. (2016). La práctica de la investigación en el trabajo social (4ª ed.) . Washington, DC: SAGE Publishing.
    3. Huggins, H. (Productor). (2016, 7 de septiembre). Por qué Uber es el sueño de un economista [Audio podcast]. Recuperado de: http://freakonomics.com/podcast/uber-economists-dream/
    4. Netting, F. E., & O'Connor, M. K. (2016). La interseccionalidad de la religión y el bienestar social: Desarrollo histórico de la salud y los servicios humanos sin fines de lucro de Richmond. Religiones, 7 (1), 13-28.
    5. Engel, R. J. & Schutt, R. K. (2016). La práctica de la investigación en el trabajo social (4ª ed.) . Washington, DC: SAGE Publishing.
    6. Estos datos no son gratuitos, aunque están disponibles a un precio razonable. Consulta la página web de Feminismos Globales en https://globalfeminisms.umich.edu/contact
    7. Parry, M. (2011, 10 de julio). Investigadores de Harvard acusados de violar la privacidad de los estudiantes. La Crónica de la Educación Superior. Recuperado de Chronicle.com/article/Harvards-Privacy-Meltdown/128166
    8. Berkman Center for Internet & Society. (2008, 25 de septiembre). Sabores, lazos y tiempo: publicación de datos en Facebook. Recuperado a partir de cyber.law.harvard.edu/node/4682

    This page titled 14.4: Análisis de datos secundarios is shared under a CC BY-NC-SA license and was authored, remixed, and/or curated by Matthew DeCarlo (Open Social Work Education) .