Saltar al contenido principal
LibreTexts Español

12.4: Realización de sus análisis

  • Page ID
    144589
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Objetivo de aprendizaje
    1. Describir los pasos involucrados en la preparación y análisis de un conjunto típico de datos sin procesar.
    2. Diferenciar entre análisis de datos planificados y exploratorios.

    Incluso cuando entiendes las estadísticas involucradas, analizar datos puede ser un proceso complicado. Es probable que para cada uno de varios participantes, haya datos para varias variables diferentes: demografía como sexo y edad, una o más variables independientes, una o más variables dependientes, y tal vez una verificación de manipulación. Además, los datos “brutos” (no analizados) pueden tomar varias formas diferentes (cuestionarios cumplimentados en papel y lápiz, archivos de computadora llenos de números o texto, videos o notas escritas) y estos pueden tener que organizarse, codificarse o combinarse de alguna manera. Incluso podría haber respuestas faltantes, incorrectas o simplemente “sospechosas” que deben tratarse. En esta sección, consideramos algunos consejos prácticos para que este proceso sea lo más organizado y eficiente posible.

    Prepare sus datos para su análisis

    Ya sea que tus datos brutos estén en papel o en un archivo de computadora (o ambos), hay algunas cosas que debes hacer antes de comenzar a analizarlos. Primero, asegúrese de que no incluyan ninguna información que pueda identificar a los participantes individuales y asegúrese de tener una ubicación segura donde pueda almacenar los datos y una ubicación segura separada donde pueda almacenar cualquier formulario de consentimiento. A menos que los datos sean altamente sensibles, una habitación cerrada o una computadora protegida con contraseña suele ser lo suficientemente buena. También es una buena idea hacer fotocopias o archivos de respaldo de sus datos y almacenarlos en otra ubicación segura, al menos hasta que el proyecto esté completo. Los investigadores profesionales suelen conservar una copia de sus datos brutos y formularios de consentimiento durante varios años en caso de que surjan preguntas sobre el procedimiento, los datos o el consentimiento de los participantes después de que se complete el proyecto.

    A continuación, debe verificar sus datos sin procesar para asegurarse de que están completos y parecen haber sido grabados con precisión (ya sean participantes, usted mismo o un programa de computadora el que realizó la grabación). En este punto, puede encontrar que hay respuestas ilegibles o faltantes, o malentendidos obvios (por ejemplo, una respuesta de “12” en una escala de calificación de 1 a 10). Tendrás que decidir si dichos problemas son lo suficientemente graves como para hacer inutilizables los datos de un participante. Si falta información sobre la variable principal independiente o dependiente, o si faltan varias respuestas o son sospechosas, es posible que deba excluir los datos de ese participante de los análisis. Si decides excluir algún dato, no los tires ni los borres porque tú u otro investigador podría querer verlos más tarde. En su lugar, déjelos a un lado y tome notas sobre por qué decidió excluirlos porque necesitará reportar esta información.

    Ahora ya estás listo para ingresar tus datos en un programa de hoja de cálculo o, si ya está en un archivo de computadora, formatearlo para su análisis. Puedes usar un programa general de hojas de cálculo como Microsoft Excel o un programa de análisis estadístico como SPSS para crear tu archivo de datos. (Los archivos de datos creados en un programa generalmente se pueden convertir para que funcionen con otros programas). El formato más común es que cada fila represente a un participante y que cada columna represente una variable (con el nombre de la variable en la parte superior de cada columna). Un archivo de datos de muestra se muestra en la Tabla\(\PageIndex{1}\). La primera columna contiene los números de identificación de los participantes. A esto le siguen columnas que contienen información demográfica (sexo y edad), variables independientes (estado de ánimo, cuatro ítems de autoestima y el total de los cuatro ítems de autoestima), y finalmente variables dependientes (intenciones y actitudes). Las variables categóricas generalmente se pueden ingresar como etiquetas de categoría (por ejemplo, “M” y “F” para hombres y mujeres) o como números (por ejemplo, “0” para el estado de ánimo negativo y “1” para el estado de ánimo positivo). Aunque las etiquetas de categoría suelen ser más claras, algunos análisis pueden requerir números. SPSS le permite ingresar números pero también adjuntar una etiqueta de categoría a cada número.

    Tabla\(\PageIndex{1}\): Archivo de datos de muestra
    ID SEXO EDAD ESTADO DE ÁNIMO SE1 SE2 SE3 SE4 TOTAL INT ATT
    1 M 20 1 2 3 2 3 10 6 5
    2 F 22 1 1 0 2 1 4 4 4
    3 F 19 0 2 2 2 2 8 2 3
    4 F 24 0 3 3 2 3 11 5 6

    Si tienes medidas de respuesta múltiple, como la medida de autoestima en Tabla,\(\PageIndex{1}\) podrías combinar los ítems a mano y luego ingresar la puntuación total en tu hoja de cálculo. Sin embargo, es mucho mejor ingresar cada respuesta como una variable separada en la hoja de cálculo, como con la medida de autoestima en Tabla,\(\PageIndex{1}\) y usar el software para combinarlas (por ejemplo, usando la función “PROMEDIO” en Excel o la función “Computar” en SPSS). Este enfoque no solo es más preciso, sino que le permite detectar y corregir errores, evaluar la consistencia interna y analizar las respuestas individuales si decide hacerlo posteriormente.

    Análisis Preliminares

    Antes de pasar a sus preguntas primarias de investigación, a menudo hay varios análisis preliminares para realizar. Para las medidas de respuesta múltiple, se debe evaluar la consistencia interna de la medida. Programas estadísticos como SPSS te permitirán calcular el α de Cronbach o el κ de Cohen. Si esto está más allá de su nivel de comodidad, aún puede calcular y evaluar una correlación de mitad dividida.

    A continuación, debes analizar cada variable importante por separado. (Este paso no es necesario para las variables independientes manipuladas, claro, porque tú como investigador determinaste cuál sería la distribución). Hacer histogramas para cada uno, anotar sus formas y calcular las medidas comunes de tendencia central y variabilidad. Asegúrate de entender lo que significan estas estadísticas en términos de las variables que te interesan. Por ejemplo, una distribución de las calificaciones de felicidad de autoreporte en una escala de 1 a 10 puntos podría ser unimodal y sesgada negativamente con una media de 8.25 y una desviación estándar de 1.14. Pero lo que esto significa es que la mayoría de los participantes se calificaron bastante altos en la escala de felicidad, con un número pequeño calificándose a sí mismos notablemente más bajos.

    Ahora es el momento de identificar valores atípicos, examinarlos más de cerca y decidir qué hacer al respecto. Podrías descubrir que lo que al principio parece ser un valor atípico es el resultado de que una respuesta se ingresa incorrectamente en el archivo de datos, en cuyo caso solo necesitas corregir el archivo de datos y seguir adelante. Alternativamente, podrías sospechar que un valor atípico representa algún otro tipo de error, malentendido o falta de esfuerzo por parte de un participante. Por ejemplo, en una distribución del tiempo de reacción en la que la mayoría de los participantes tardaron solo unos segundos en responder, un participante que tardó 3 minutos en responder sería un valor atípico. Parece probable que este participante no entendiera la tarea (o al menos no estaba prestando mucha atención). Además, incluir su tiempo de reacción tendría un gran impacto en la media y desviación estándar para la muestra. En situaciones como esta, puede justificarse excluir de los análisis a la respuesta alejada o participante. Sin embargo, si haces esto, debes tomar notas sobre qué respuestas o participantes has excluido y por qué, y aplicar esos mismos criterios de manera consistente a cada respuesta y a cada participante. Cuando presente sus resultados, debe indicar cuántas respuestas o participantes excluyó y los criterios específicos que utilizó. Y nuevamente, no tires literalmente ni borres los datos que elijas excluir. Simplemente déjelos a un lado porque usted u otro investigador tal vez quiera verlos más tarde.

    Tenga en cuenta que los valores atípicos no necesariamente representan un error, malentendido o falta de esfuerzo. Pueden representar respuestas o participantes verdaderamente extremos. Por ejemplo, en una gran muestra de estudiantes universitarios, la gran mayoría de los participantes reportaron haber tenido menos de 15 parejas sexuales, pero también hubo algunas puntuaciones extremas de 60 o 70 (Brown & Sinclair, 1999) [1]. Si bien estos puntajes pueden representar errores, malentendidos o incluso exageraciones intencionales, también es plausible que representen estimaciones honestas e incluso precisas. Una estrategia aquí sería usar la mediana y otras estadísticas que no se vean fuertemente afectadas por los valores atípicos. Otra sería analizar los datos tanto incluyendo como excluyendo cualquier valor atípico. Si los resultados son esencialmente los mismos, que a menudo son, entonces tiene sentido dejar los valores atípicos. Si los resultados difieren dependiendo de si se incluyen o excluyen los valores atípicos, entonces se pueden reportar ambos análisis y discutir las diferencias entre ellos.

    Análisis Planeados y Exploratorios

    Por último, estás listo para responder tus preguntas primarias de investigación. Cuando diseñaste tu estudio, podrías haber tenido la hipótesis de que una relación particular podría existir en los datos. En este caso, realizarías un análisis planificado, para probar una relación que esperabas en tu hipótesis. Por ejemplo, si esperaba una diferencia entre medias de grupo o condición, puede calcular las medias de grupo o condición relevantes y desviaciones estándar, hacer un gráfico de barras para mostrar los resultados y calcular la d de Cohen. Si esperaba una correlación entre variables cuantitativas, puede hacer un gráfico de líneas o un diagrama de dispersión (asegúrese de verificar la no linealidad y restricción de rango) y calcular la r de Pearson.

    Una vez que haya realizado sus análisis planificados, puede pasar a examinar la posibilidad de que haya relaciones en los datos que no planteó la hipótesis. Esto sería un análisis exploratorio, un análisis que estás emprendiendo sin una hipótesis existente. Estos análisis le ayudarán a explorar sus datos para obtener otros resultados interesantes que podrían proporcionar la base para futuras investigaciones (y material para la sección de discusión de su trabajo). Daryl Bem (2003) sugiere que

    [e] xamina [sus datos] desde todos los ángulos. Analizar los sexos por separado. Conformar nuevos índices compuestos. Si un dato sugiere una nueva hipótesis, intente encontrar evidencia adicional para ello en otra parte de los datos. Si ves rastros tenues de patrones interesantes, trata de reorganizar los datos para llevarlos a un relieve más audaz. Si hay participantes que no te gustan, o ensayos, observadores o entrevistadores que te dieron resultados anómalos, suéltelos (temporalmente). Ve a una expedición de pesca por algo, cualquier cosa, interesante. (págs. 186—187) [2]

    Es importante diferenciar los análisis planificados de los exploratorios al escribir sus resultados y secciones de discusión de su informe. Esto se debe a que es probable que conjuntos complejos de datos incluyan “patrones” que ocurrieron completamente por casualidad, y cada vez que haces otro análisis no planificado sobre estos datos, aumentas la probabilidad de que estos patrones de probabilidad parezcan ser patrones reales, lo que se conoce como un error de “Tipo 1” (vea el capítulo sobre Estadística Inferencial). Así, los resultados descubiertos al realizar análisis exploratorios (lo que Bem llama una “expedición pesquera”) deben ser vistos escépticamente y replicados en al menos un nuevo estudio antes de ser presentados. Pero, si encuentras relaciones interesantes que no esperabas en los datos, explica que podrían ser dignas de investigación adicional.

    Entiende tus estadísticas descriptivas

    En el siguiente capítulo, consideraremos las estadísticas inferenciales, un conjunto de técnicas para decidir si es probable que los resultados de su muestra se apliquen a la población. Si bien las estadísticas inferenciales son importantes por razones que se explicarán en breve, los investigadores principiantes a veces olvidan que sus estadísticas descriptivas realmente cuentan “lo que pasó” en su estudio. Por ejemplo, imagine que un grupo de tratamiento de 50 participantes tiene una puntuación media de 34.32 (DE = 10.45), un grupo control de 50 participantes tiene una puntuación media de 21.45 (DE = 9.22), y la d de Cohen es una extremadamente fuerte 1.31. Si bien realizar y reportar estadísticas inferenciales (como una prueba t) sin duda sería una parte requerida de cualquier informe formal sobre este estudio, debe quedar claro solo a partir de la estadística descriptiva que el tratamiento funcionó. O imagina que una gráfica de dispersión muestra una “nube” indistinta de puntos y la r de Pearson es una trivial −.02. Nuevamente, aunque realizar y reportar estadísticas inferenciales sería una parte requerida de cualquier informe formal sobre este estudio, debe quedar claro solo a partir de la estadística descriptiva que las variables son esencialmente no relacionadas. El punto es que siempre debes estar seguro de que primero entiendes a fondo tus resultados a nivel descriptivo, y luego pasar a las estadísticas inferenciales.

    Referencias

    1. Brown, N. R., & Sinclair, R. C. (1999). Estimación del número de parejas sexuales de por vida: Hombres y mujeres lo hacen de manera diferente. The Journal of Sex Research, 36, 292—297.
    2. Bem, D. J. (2003). Redacción del artículo empírico de revista. En J. M. Darley, M. P. Zanna, & H. L. Roediger III (Eds.), El académico completo: Una guía de carrera (2a ed., pp. 185—219). Washington, DC: Asociación Americana de Psicología.

    This page titled 12.4: Realización de sus análisis is shared under a CC BY-NC-SA license and was authored, remixed, and/or curated by Rajiv S. Jhangiani, I-Chant A. Chiang, Carrie Cuttler, & Dana C. Leighton.