Saltar al contenido principal
Library homepage
 
LibreTexts Español

Caso C-Q

  • Page ID
    151255
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    CO-4: Distinguir entre diferentes escalas de medición, elegir los métodos estadísticos descriptivos e inferenciales adecuados con base en estas distinciones e interpretar los resultados.

    Objetivos de aprendizaje

    LO 4.20: Clasificar una situación de análisis de datos que involucra dos variables de acuerdo con la “clasificación de tipo rol”.

    Objetivos de aprendizaje

    LO 4.21: Para una situación de análisis de datos que involucre dos variables, determinar la (s) visualización (es) gráfica (es) apropiada (s) y/o medidas numéricas que deben usarse para resumir los datos.

    Video

    Vídeo: Caso C-Q (6:34)

    Tutoriales SAS relacionados

    Tutoriales relacionados con SPSS

    Respuesta Categórica Explicativa y Cuantitativa

    Objetivos de aprendizaje

    LO 4.18: Comparar y contrastar distribuciones (de datos cuantitativos) de dos o más grupos, y producir un breve resumen, interpretando sus hallazgos en contexto.

    Recordemos la tabla de clasificación de tipo rol para enmarcar nuestra discusión sobre la relación entre dos variables:

    Es posible que cualquier tipo de variable explicativa se empareja con cualquier tipo de variable de respuesta. Los posibles emparejamientos son: Explicativo Categórico → Respuesta Categórica (C→C), Explicativo Categórico → Respuesta Cuantitativa (C→Q), Explicativo Cuantitativo → Respuesta Categórica (Q→C) y Explicativo Cuantitativo → Respuesta Cuantitativa (Q→Q). En esta sección estaremos trabajando en C→Q

    Ahora estamos listos para comenzar con el Caso C→Q, explorando la relación entre dos variables donde la variable explicativa es categórica, y la variable respuesta es cuantitativa. Como descubrirás, explorar relaciones de este tipo es algo que ya hemos discutido en este curso, pero no enmarcamos la discusión de esta manera.

    EJEMPLO: Perros calientes

    Antecedentes: Las personas que están preocupadas por su salud pueden preferir los perritos calientes bajos en calorías. Se realizó un estudio por un grupo de salud preocupado en el que se examinaron 54 grandes marcas de perritos calientes y se registró su contenido calórico. Además, cada marca se clasificó por tipo: carne de res, aves y carne (principalmente de cerdo y carne de res, pero hasta 15% de carne de ave). El propósito del estudio fue examinar si el número de calorías que tiene un hot dog está relacionado con (o afectado por) su tipo. (Referencia: Moore, David S., y George P. McCabe (1989). Introducción a la práctica de la estadística. Fuente original: Consumer Reports, junio de 1986, pp. 366-367.)

    Responder a esta pregunta requiere que examinemos la relación entre la variable categórica, Tipo y la variable cuantitativa Calorías. Porque la cuestión de interés es si el tipo de hot dog afecta el contenido calórico,

    • la variable explicativa es Tipo, y
    • la variable de respuesta es Calorías.

    Así es como se ven los datos sin procesar:

    Una tabla de los datos. Hay tres columnas, “Marca”, “Tipo” y “Calorías”. “Tipo” es la variable Explicativa, y “Calorías” es la variable Respuesta. Algunos datos de ejemplo: Marca 1, Carne de res, 186; Marca 2, Avicultura, 129; Marca 3, Carne, 181; Marca 4, Carne, 173;... (abreviado)... Marca 54, Avicultura, 144

    Los datos brutos son una lista de tipos y contenidos calóricos, y no son muy útiles en esa forma. Para explorar cómo se relaciona el número de calorías con el tipo de hot dog, necesitamos una exhibición visual informativa de los datos que comparará los tres tipos de hot dogs con respecto a su contenido calórico.

    La pantalla visual que usaremos son las gráficas de caja lado a lado (que ya hemos visto antes). Las parcelas de caja lado a lado nos permitirán comparar la distribución de los recuentos de calorías dentro de cada categoría de la variable explicativa, tipo hot dog:

    Tres parcelas de caja. El eje vertical está etiquetado como “Calorías”. Hay tres parcelas de caja, una para carne de res, otra carne y aves de corral. Las características de la gráfica de caja se resumen en la siguiente tabla.

    Como antes, complementamos los diagramas de caja lado a lado con los estadísticos descriptivos del contenido calórico (respuesta) para cada tipo de hot dog por separado (es decir, para cada nivel de la variable explicativa por separado):

    Resumimos los resultados obtenidos e interpretarlos en el contexto de la pregunta que planteamos:

    Estadística Carne de res Carne Avícolas
    min 111 107 86
    Q1 139.5 138.5 100.5
    Mediana 152.5 153 113
    Q3 179.75 180.5 142.5
    Max 190 195 152

    Al examinar las tres parcelas de caja lado a lado y las medidas numéricas, vemos a la vez que los hot dogs de aves de corral, como grupo, contienen menos calorías que los hechos de carne de res o carne. La mediana del número de calorías en los perritos calientes de aves de corral (113) es menor que la mediana (e incluso el primer cuartil) de cualquiera de las otras dos distribuciones (medianas 152.5 y 153). La propagación de las tres distribuciones es aproximadamente la misma, si se considera IQR (todas ligeramente superiores a 40), pero los rangos (completos) varían ligeramente más (carne: 80, carne: 88, aves: 66). La recomendación general para el consumidor consciente de la salud es comer perritos calientes de aves de corral. Cabe señalar, sin embargo, que dado que cada uno de los tres tipos de hot dogs muestra una distribución bastante grande entre las marcas, el simple hecho de comprar un hot dog de aves de corral no garantiza un alimento bajo en calorías.

    Lo que aprendemos de este ejemplo es que al explorar la relación entre una variable explicativa categórica y una respuesta cuantitativa (Caso C→Q), esencialmente comparamos las distribuciones de la respuesta cuantitativa para cada categoría de la variable explicativa usando diagramas de caja lado a lado complementado con estadísticas descriptivas. Recordemos que en realidad lo hemos hecho antes cuando hablamos de la gráfica de caja y argumentamos que las gráficas de caja son más útiles cuando se presentan lado a lado para comparar distribuciones de dos o más grupos. ¡Esto es exactamente lo que estamos haciendo aquí!

    Aquí hay otro ejemplo:

    EJEMPLO: SSHA

    Fundamento: La Encuesta de Hábitos y Actitudes de Estudio (SSHA) es una prueba psicológica diseñada para medir la motivación, los hábitos de estudio y las actitudes hacia el aprendizaje de estudiantes universitarios. ¿Existe una relación entre el género y los puntajes de SSHA? En otras palabras, ¿existe un “efecto de género” en los puntajes de SSHA? Se recolectaron datos de 40 estudiantes universitarios seleccionados al azar, y así es como se ven los datos brutos:

    Una tabla de los datos. Hay tres columnas, “Estudiante”, “Género” y “Puntuación SSHA”. “Género” es la variable Explicativa, y “Puntuación SSHA” es la variable Respuesta. Algunos datos de ejemplo: Estudiante 1, Femenino, 154; Estudiante 2, Femenino, 109; Estudiante 3, Masculino, 108; Estudiante 4, Femenino, 115;... (abreviado)... Estudiante 40, Hombre, 140;

    (Referencia: Moore y McCabe. (2003). Introducción a la práctica de la estadística)

    Las parcelas de caja lado a lado complementadas con estadísticas descriptivas permiten comparar la distribución de los puntajes de SSHA dentro de cada categoría de la variable explicativa—género:

    Dos parcelas de caja. El eje vertical está etiquetado como “SSHA Score”. Hay dos parcelas de caja, una para Hembra y Masculina para cada una. Las características de la gráfica de caja se resumen en la siguiente tabla.

    Estadística Hembra Macho
    min 103 70
    Q1 128.75 95
    Mediana 153 114.5
    Q3 163.75 144.5
    Max 200 187

    Resumimos nuestros resultados e interpretémoslos:

    Al examinar las parcelas de caja lado a lado y las medidas numéricas, vemos que en general las hembras se desempeñan mejor en el SSHA que los machos. La mediana de la puntuación SSHA de las mujeres es mayor que la mediana de los varones (153 vs. 114), y de hecho, es incluso mayor que el tercer cuartil de la distribución masculina (144.5). Por otro lado, las puntuaciones de los varones muestran mayor variabilidad, tanto en términos de IQR (49.5 vs. 35) como en términos del rango completo de puntuaciones (117 vs. 97). Con base en estos resultados, parece que hay un efecto de género en la puntuación de SSHA. Cabe señalar, sin embargo, que nuestra muestra consta de solo 20 machos y 20 hembras, por lo que debemos ser cautelosos al hacer cualquier tipo de generalizaciones más allá de este estudio. Una pregunta interesante que me viene a la mente es: “¿Por qué observamos esta relación entre el género y las puntuaciones de SSHA?” En otras palabras, ¿hay tal vez una explicación de por qué las mujeres obtienen puntajes más altos en la SSHA? Dejémosle a los psicólogos tratar de responder a esa.

    Resumimos

    • La relación entre una variable explicativa categórica y una variable de respuesta cuantitativa se resume utilizando:
      • Visualización visual: diagramas de caja lado a lado
      • Medidas numéricas: estadística descriptiva utilizada para una variable cuantitativa calculada en cada grupo
    • Explorar la relación entre una variable explicativa categórica y una variable de respuesta cuantitativa equivale a comparar las distribuciones de la respuesta cuantitativa para cada categoría de la variable explicativa. En particular, observamos cómo la distribución de la variable de respuesta difiere entre los valores de la variable explicativa

    Caso C-Q is shared under a CC BY-NC-SA 4.0 license and was authored, remixed, and/or curated by LibreTexts.