CO-4: Distinguir entre diferentes escalas de medición, elegir los métodos estadísticos descriptivos e inferenciales adecuados con base en estas distinciones e interpretar los resultados.
Si bien es fundamentalmente importante saber describir la distribución de una sola variable, la mayoría de los estudios plantean preguntas de investigación que implican explorar la relación entre dos (o más) variables. Estas preguntas de investigación se investigan utilizando una muestra de la población de interés.
Aquí hay algunos ejemplos de tales preguntas de investigación con las dos variables resaltadas:
EJEMPLOS:
- ¿Existe una relación entre el género y los resultados de las pruebas en una prueba estandarizada en particular? Otras formas de formular la misma pregunta de investigación:
- ¿El desempeño en la prueba está relacionado con el género?
- ¿Hay un efecto de género en los puntajes de los exámenes
- ¿Existen diferencias en los puntajes de las pruebas entre hombres y mujeres?
- ¿Cómo se relaciona el número de calorías en un hot dog con (o se ve afectado por) el tipo de hot dog (carne de res, carne o aves de corral)? Es decir, ¿existen diferencias en el número de calorías entre los tres tipos de hot dogs?
- ¿Existe una relación entre el tipo de luz con la que duerme un bebé (sin luz, luz nocturna, lámpara) y si el niño desarrolla mirilla o no?
- ¿Los hábitos de fumar de una persona (sí, no) están relacionados con el género de la persona?
- ¿Qué tan bien podemos predecir el GPA del primer año de un estudiante a partir de su puntaje SAT?
- ¿Cuál es la relación entre la edad del conductor y la distancia de legibilidad de la señal (la distancia máxima a la que el conductor puede leer un letrero)?
- ¿Existe una relación entre el tiempo que una persona ha practicado la conducción mientras tiene un permiso de aprendizaje, y si esta persona pasó o no el examen de manejo?
- ¿Puedes predecir el tipo de música favorita de una persona (clásica, rock, jazz) en función de su nivel de coeficiente intelectual?
Papel de una variable en un estudio
Objetivos de aprendizaje
LO 4.19: Para una situación de análisis de datos que involucre dos variables, identificar el papel de cada variable en el escenario.
En la mayoría de los estudios que involucran dos variables, cada una de las variables tiene un papel. Distinguimos entre:
- la variable respuesta — el resultado del estudio; y
- la variable explicativa — la variable que pretende explicar, predecir o afectar la respuesta.
Como mencionamos anteriormente, la variable que queremos predecir se llama comúnmente la variable dependiente, la variable de resultado o la variable de respuesta. Cualquier variable que estemos usando para predecir (o explicar diferencias) en el resultado se llama comúnmente una variable explicativa, una variable independiente, una variable predictora o una covariable.
Comentario:
- Por lo general, la variable explicativa se denota con X, y la variable de respuesta por Y.
Ahora volvamos a algunos de los ejemplos y clasifiquemos las dos variables relevantes según sus roles en el estudio:
EJEMPLO 1:
¿Existe una relación entre el género y los resultados de las pruebas en una prueba estandarizada en particular? Otras formas de formular la misma pregunta de investigación:
- ¿El desempeño en la prueba está relacionado con el género?
- ¿Hay un efecto de género en los puntajes de los exámenes
- ¿Existen diferencias en los puntajes de las pruebas entre hombres y mujeres?
Queremos explorar si el resultado del estudio —el puntaje de una prueba— se ve afectado por el género del examinador. Por lo tanto:
El género es la variable explicativa
La puntuación de la prueba es la variable de respuesta
EJEMPLO 3:
¿Existe una relación entre el tipo de luz con la que duerme un bebé (sin luz, luz nocturna, lámpara) y si el niño desarrolla mirilla o no?
En este estudio exploramos si la mimetropía de una persona puede explicarse por el tipo de luz con la que se acostó cuando era bebé. Por lo tanto:
El tipo de luz es la variable explicativa
La mimetropía es la variable de respuesta
EJEMPLO 5:
¿Qué tan bien podemos predecir el GPA del primer año de un estudiante a partir de su puntaje SAT?
Aquí estamos examinando si el puntaje SAT de un estudiante es un buen predictor para el primer año de GPA del estudiante. Por lo tanto:
La puntuación SAT es la variable explicativa
El GPA del primer año es la variable de respuesta
EJEMPLO 7:
¿Existe una relación entre el tiempo que una persona ha practicado la conducción mientras tiene un permiso de aprendizaje, y si esta persona pasó o no el examen de manejo?
Aquí estamos examinando si el resultado de una persona en el examen de manejo (aprobado/reprobar) puede explicarse por el tiempo que esta persona ha practicado la conducción antes de la prueba. Por lo tanto:
El tiempo es la variable explicativa
El resultado del examen de manejo es la variable de respuesta
Ahora, usando el mismo razonamiento, el siguiente ejercicio te ayudará a clasificar las dos variables en los otros ejemplos.
Muchos estudiantes se preguntan: Clasificación de roles
Pregunta : ¿La clasificación de roles de las variables es siempre clara? Es decir, ¿siempre queda claro cuál de las variables es la explicativa y cuál es la respuesta?
Respuesta: No. Hay estudios en los que la clasificación de roles no es realmente clara. Esto ocurre principalmente en los casos en que ambas variables son categóricas o ambas son cuantitativas. Un ejemplo es un estudio que explora la relación entre los puntajes SAT Math y SAT Verbal de los estudiantes. En casos como este, cualquier elección de clasificación estaría bien (siempre y cuando sea consistente a lo largo del análisis).
Clasificación de Tipo de Rol
Objetivos de aprendizaje
LO 4.20: Clasificar una situación de análisis de datos que involucra dos variables de acuerdo con la “clasificación de tipo rol”.
Si además clasificamos cada una de las dos variables relevantes según el tipo (categórica o cuantitativa), obtenemos las siguientes 4 posibilidades para la “clasificación de tipo rol”
- Respuesta categórica explicativa y cuantitativa (Caso CQ)
- Respuesta categórica explicativa y categórica (Caso CC)
- Respuesta cuantitativa explicativa y cuantitativa (Caso QQ)
- Respuesta cuantitativa explicativa y categórica (Caso QC)
Esta clasificación de tipo rol se puede resumir y visualizar fácilmente en la siguiente tabla (tenga en cuenta que la variable explicativa siempre se enumera primero):
Esta clasificación de tipo rol sirve como infraestructura para toda esta sección. En cada uno de los 4 casos, se deben utilizar diferentes herramientas estadísticas (displays y medidas numéricas) para explorar la relación entre las dos variables.
Esto sugiere el siguiente principio importante:
PRINCIPIO: Ante una pregunta de investigación que implica explorar la relación entre dos variables, el primer y más crucial paso es determinar cuál de los 4 casos representa la estructura de datos del problema. En otras palabras, el primer paso debe ser clasificar las dos variables relevantes según su rol y tipo, y sólo entonces podremos determinar qué herramientas estadísticas se deben utilizar para analizarlas.
Ahora volvamos a nuestros 8 ejemplos y determinemos cuál de los 4 casos representa la estructura de datos de cada uno:
EJEMPLO 1:
¿Existe una relación entre el género y los resultados de las pruebas en una prueba estandarizada en particular? Otras formas de formular la misma pregunta de investigación:
- ¿El desempeño en la prueba está relacionado con el género?
- ¿Hay un efecto de género en los puntajes de los exámenes
- ¿Existen diferencias en los puntajes de las pruebas entre hombres y mujeres?
Queremos explorar si el resultado del estudio —el puntaje de una prueba— se ve afectado por el género del examinador.
El género es la variable explicativa y categórica.
La puntuación de la prueba es la variable de respuesta y es cuantitativa.
Por lo tanto este es un ejemplo del caso C → Q.
EJEMPLO 3:
¿Existe una relación entre el tipo de luz con la que duerme un bebé (sin luz, luz nocturna, lámpara) y si el niño desarrolla mirilla o no?
En este estudio exploramos si la mimetropía de una persona puede explicarse por el tipo de luz con la que se acostó cuando era bebé.
El tipo de luz es la variable explicativa y es categórica.
La mimetropía es la variable de respuesta y es categórica.
Por lo tanto este es un ejemplo del caso C → C.
EJEMPLO 5:
¿Qué tan bien podemos predecir el GPA del primer año de un estudiante a partir de su puntaje SAT?
Aquí estamos examinando si el puntaje SAT de un estudiante es un buen predictor para el primer año de GPA del estudiante.
El puntaje SAT es la variable explicativa y es cuantitativa.
El GPA del primer año es la variable de respuesta y es cuantitativo.
Por lo tanto este es un ejemplo del caso Q → Q.
EJEMPLO 7:
¿Existe una relación entre el tiempo que una persona ha practicado la conducción mientras tiene un permiso de aprendizaje, y si esta persona pasó o no el examen de manejo?
Aquí estamos examinando si el resultado de una persona en el examen de manejo (aprobado/reprobar) puede explicarse por el tiempo que esta persona ha practicado la conducción antes de la prueba.
El tiempo es la variable explicativa y es cuantitativa.
El resultado del examen de manejo es la variable de respuesta y es categórico.
Por lo tanto este es un ejemplo del caso Q → C.
Ahora completa el resto...
El resto de esta sección sobre exploración de relaciones se guiará por esta clasificación de tipo de rol. En las siguientes tres partes elaboraremos los casos C→Q, C→C y Q→Q. Más específicamente, aprenderemos las herramientas estadísticas adecuadas (visualización visual y medidas numéricas) que nos permitirán explorar la relación entre las dos variables en cada uno de los casos. El caso Q→C no se discutirá en este curso, y generalmente se cubre en cursos más avanzados. La sección concluirá con una discusión sobre las relaciones causales.