Saltar al contenido principal
Library homepage
 
LibreTexts Español

Caso C-C

  • Page ID
    151252
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    CO-4: Distinguir entre diferentes escalas de medición, elegir los métodos estadísticos descriptivos e inferenciales adecuados con base en estas distinciones e interpretar los resultados.

    Objetivos de aprendizaje

    LO 4.20: Clasificar una situación de análisis de datos que involucra dos variables según la “clasificación de tipo rol”.

    Objetivos de aprendizaje

    LO 4.21: Para una situación de análisis de datos que involucre dos variables, determinar la (s) visualización (es) gráfica (es) apropiada (s) y/o medidas numéricas que deben usarse para resumir los datos.

    Video

    Vídeo: Caso C-C (10:34)

    Tutoriales SAS relacionados

    Tutoriales relacionados con SPSS

    Dos variables categóricas

    Recordemos la tabla de clasificación de tipo rol para enmarcar nuestra discusión sobre la relación entre dos variables:

    Terminamos con el caso C→Q, y ahora pasaremos al caso C→C, donde examinamos la relación entre dos variables categóricas.

    Anteriormente en el curso, (cuando discutimos la distribución de una sola variable categórica) examinamos los datos obtenidos cuando se preguntó a una muestra aleatoria de 1,200 estudiantes universitarios estadounidenses sobre su imagen corporal (bajo peso, sobrepeso o sobre la derecha). Ahora volvemos a este ejemplo, para abordar la siguiente pregunta:

    Si hubiéramos separado nuestra muestra de 1,200 estudiantes universitarios estadounidenses por género y hubiéramos visto a hombres y mujeres por separado, ¿habríamos encontrado una distribución similar entre las categorías de imagen corporal? Más específicamente, ¿son los hombres y las mujeres igual de propensos a pensar que su peso es correcto? Entre esos estudiantes que no piensan que su peso es lo correcto, ¿hay alguna diferencia entre los géneros en los sentimientos sobre la imagen corporal?

    Responder a estas preguntas requiere examinar la relación entre dos variables categóricas, género e imagen corporal. Porque la cuestión de interés es si existe un efecto de género en la imagen corporal,

    • la variable explicativa es género, y
    • la variable de respuesta es imagen corporal.

    Así es como se ven los datos brutos cuando incluimos el género de cada alumno:

    Una tabla de los datos. Hay tres columnas, “Estudiante”, “Género” e “Imagen Corporal”. “Género” es la variable Explicativa, y “Imagen corporal” es la variable Respuesta. Algunos datos de ejemplo:... (abreviado)... estudiante 25, M, sobrepeso; estudiante 26, M, aproximadamente a la derecha; estudiante 27, F, bajo peso; estudiante 28, F, aproximadamente a la derecha; estudiante 29, M, aproximadamente a la derecha;... (abreviado)...

    Una vez más los datos brutos son una larga lista de 1,200 géneros y respuestas, y por lo tanto no son muy útiles en esa forma.

    Tablas de Contingencia

    Objetivos de aprendizaje

    LO 4.22: Definir y explicar el proceso de creación de una tabla de contingencia (tabla bidireccional).

    Para iniciar nuestra exploración de cómo se relaciona la imagen corporal con el género, necesitamos una exhibición informativa que resuma los datos. Para resumir la relación entre dos variables categóricas, creamos una pantalla llamada tabla bidireccional o tabla de contingencia.

    Aquí está la mesa bidireccional para nuestro ejemplo:

    Una mesa de dos vías. Las columnas son para cada categoría posible en “Imagen Corporal”. Estas categorías son “Acerca de lo correcto”, “Sobrepeso “, “Bajo Peso”. También hay una columna adicional para Total. Además, hay una fila para cada una de las categorías en “Género”. Estos son “Femenino” y “Masculino” También hay una fila Total adicional. Entonces, en general, hay 4 columnas con los nombres “About Right”, “Overweight”, “Underweight”, y “Total”. Hay 3 filas, “Hembra”, “Masculino” y “Total”. Aquí están los valores en las celdas, en Fila, Columna: Formato de valor: Femenino, Acerca de Derecha: 560; Femenino, Sobrepeso: 163; Femenino, Bajo Peso: 37; Femenino, Total: 760; Masculino, Acerca de Derecha: 295; Masculino, Sobrepeso: 72; Masculino, Bajo Peso: 73; Masculino, Total: 440; Total, Acerca de Derecha: 855; Total, Sobrepeso: 235; Total, Bajo Peso : 110; Total, Total (Total # de Respuestas): 1200;

    La tabla tiene los géneros posibles en las filas, y las posibles respuestas con respecto a la imagen corporal en las columnas. En cada intersección entre fila y columna, colocamos los recuentos de cuántas veces esa combinación de género e imagen corporal ocurrió en los datos. Sumamos a través de las filas para rellenar la columna Total, y sumamos a través de las columnas para rellenar la fila Total.

    Completar las siguientes actividades relacionadas con estos datos.

    Aprender haciendo: Caso C-C

    Comentarios:

    Tenga en cuenta que a partir de la forma en que se construye la tabla bidireccional, la fila o columna Total es un resumen de una de las dos variables categóricas, ignorando la otra. En nuestro ejemplo:

    • La fila Total da el resumen de la imagen corporal de la variable categórica:

    La misma tabla que la presentada anteriormente, salvo que se resaltan los encabezamientos de las columnas y la fila total. Indica que las celdas para “Total, Acerca de la Derecha”, “Total, Sobrepeso”, “Total, Bajo Peso “y “Total, Total” son un resumen de cada tipo de imagen corporal mostrando los totales para cada categoría, o en el caso de la celda “Total, Total”, el número total de “Acerca de la Derecha”, “Sobrepeso” y “Bajo Peso” respuestas.

    • La columna Total da el resumen de la variable categórica género: (Estos son los mismos recuentos que encontramos anteriormente en el curso cuando miramos la imagen corporal de la variable categórica única, y no consideramos género).

    La misma tabla que la presentada anteriormente, salvo que se resaltan los encabezamientos de fila y la fila total. Indica que las celdas para “Femenino, Total”, “Masculino, Total” y “Total, Total” son un resumen de cada tipo de género al mostrar los totales para cada uno, o en el caso de la celda “Total, Total”, el número total de respuestas “Femenino” y “Masculino”.

    Búsqueda de porcentajes condicionales (fila y columna)

    Objetivos de aprendizaje

    LO 4.23: Dada una tabla de contingencia (tabla bidireccional), interpretar la información que revela sobre la asociación entre dos variables categóricas calculando y comparando porcentajes condicionales.

    Hasta ahora hemos organizado los datos brutos en una pantalla mucho más informativa, la tabla bidireccional:

    La misma tabla que en la página anterior. La descripción de la misma para referencia: Una mesa bidireccional. Las columnas son para cada categoría posible en “Imagen Corporal”. Estas categorías son “Acerca de la derecha” “Sobrepeso”, “Bajo Peso”. También hay una columna adicional para Total. Además, hay una fila para cada una de las categorías en “Género”. Estos son “Femenino” y “Masculino” También hay una fila Total adicional. Entonces, en general, hay 4 columnas con los nombres “About Right”, “Overweight”, “Underweight”, y “Total”. Hay 3 filas, “Hembra”, “Masculino” y “Total”. Aquí están los valores en las celdas, en Fila, Columna: Formato de valor: Femenino, Acerca de Derecha: 560; Femenino, Sobrepeso: 163; Femenino, Bajo Peso: 37; Femenino, Total: 760; Masculino, Acerca de Derecha: 295; Masculino, Sobrepeso: 72; Masculino, Bajo Peso: 73; Masculino, Total: 440; Total, Acerca de Derecha: 855; Total, Sobrepeso: 235; Total, Bajo Peso : 110; Total, Total (Total # de Respuestas): 1200;

    Recuerde, sin embargo, que nuestro objetivo principal es explorar cómo la imagen corporal se relaciona con el género. Explorar la relación entre dos variables categóricas (en este caso imagen corporal y género) equivale a comparar las distribuciones de la variable respuesta (en este caso imagen corporal) a través de los diferentes valores de la variable explicativa (en este caso hombres y mujeres):

    La tabla de dos vías con las filas “Hembra” y “Masculina” resaltadas. Estas son las filas para las que necesitamos comparar distribuciones.

    Tenga en cuenta que no tiene sentido comparar los recuentos crudos, porque en general hay más hembras que machos. Entonces, por ejemplo, no es muy informativo decir “hay 560 hembras que respondieron 'sobre la correcta' en comparación con sólo 295 machos”, ya que las 560 hembras son de un total de 760, y los 295 machos son de un total de sólo 440.

    Necesitamos complementar nuestra pantalla, la mesa bidireccional, con algunas medidas numéricas que nos permitan comparar las distribuciones. Estas medidas numéricas se encuentran simplemente convirtiendo los recuentos a porcentajes dentro (o restringidos a) cada valor de la variable explicativa por separado.

    En nuestro ejemplo: Miramos cada género por separado, y convertimos los recuentos a porcentajes dentro de ese género. Empecemos con las hembras:

    La misma tabla, pero con porcentajes en cambio, y sin la fila “Total”. Aquí están las celdas, en formato “Fila, Columna: Valor": Femenino, Acerca de Derecha: 560/760 = 73.7%; Femenino, Sobrepeso: 163/760 = 21.4%; Femenino, Bajo Peso: 37/760 = 4.9%; Femenino, Total: 760/760 = 100%; La fila Masculina está en blanco.

    Obsérvese que cada conteo se convierte en porcentajes dividiendo por el número total de hembras, 760. Estas medidas numéricas se denominan porcentajes condicionales, ya que las encontramos por “condicionamiento” en uno de los géneros.

    Ahora completa las siguientes actividades para calcular los porcentajes de fila para machos.

    Aprender haciendo: Cálculo de porcentajes de fila

    Comentarios:

    • En nuestro ejemplo, optamos por organizar los datos con la variable explicativa género en filas y la variable de respuesta imagen corporal en columnas, y así nuestros porcentajes condicionales fueron porcentajes de fila, calculados dentro de cada fila por separado. De igual manera, si la variable explicativa pasa a sentarse en columnas y la variable de respuesta en filas, nuestros porcentajes condicionales serán porcentajes de columna, calculados dentro de cada columna por separado. Para un ejemplo, vea el “¿Conseguí esto?” ejercicios a continuación.
    • Otra forma de visualizar los porcentajes condicionales, en lugar de una tabla, es el gráfico de barras dobles. Esta exhibición es bastante común en los periódicos.

    Una tabla bidireccional, la misma que la tabla anterior explicando porcentajes condicionales. No obstante, se ha rellenado la fila “Masculina”. Las celdas en formato “Fila, Columna: Valor”: Femenino, Acerca de Derecha: 73.7%; Femenino, Sobrepeso: 21.4%; Femenino, Bajo Peso: 4.9%; Femenino, Total: 100%; Masculino, Acerca de Derecha: 67.0%; Masculino, Sobrepeso: 16.4%; Masculino, Bajo Peso: 16.6%; Masculino, Total: 100%; Debajo de esto hay un gráfico de barras dobles. El eje vertical está etiquetado como “Porcentaje”, oscila entre 0 y 80%. El eje horizontal está etiquetado como “Imagen Corporal”. Hay 3 subcategorías que conforman 3 grupos de barras. Estas categorías son “aproximadamente correctas”, “con sobrepeso” y “bajo peso”. Cada categoría tiene dos barras, una para hombre y otra para mujer, para un total de 6 barras en la gráfica. Aquí están las barras, y sus valores: Acerca de Derecha, Mujeres: 73.7% Acerca de Derecha, Hombres: 67.0% Sobrepeso, Mujeres: 21.4% Sobrepeso, Hombres: 16.4% Bajo Peso, Mujeres: 4.9% Bajo Peso, Masculino: 16.6%

    Ahora que hemos resumido la relación entre las variables categóricas género e imagen corporal, volvamos e interpretemos los resultados en el contexto de las preguntas que planteamos.

    Aprender haciendo: Interpretación en el Caso C-C

    Aprende haciendo: Case C-C (Software)

    Para la práctica adicional complete las siguientes actividades.

    ¿Conseguí esto? : Caso C-C

    Vamos a resumir

    • La relación entre dos variables categóricas se resume utilizando:
      • Visualización de datos: mesa bidireccional, complementada por
      • Medidas numéricas: porcentajes condicionales.
    • Los porcentajes condicionales se calculan por separado para cada valor de la variable explicativa. Pueden ser porcentajes de fila, si la variable explicativa “se sienta” en las filas, o porcentajes de columna, si la variable explicativa “se sienta” en las columnas.
    • Cuando tratamos de entender la relación entre dos variables categóricas, comparamos las distribuciones de la variable de respuesta para los valores de la variable explicativa. En particular, observamos cómo el patrón de porcentajes condicionales difiere entre los valores de la variable explicativa.

    Caso C-C is shared under a CC BY-NC-SA 4.0 license and was authored, remixed, and/or curated by LibreTexts.