1.1: Terminología - Individuos/Población/Variables/Muestras
( \newcommand{\kernel}{\mathrm{null}\,}\)
Estadísticas de una variable: Conceptos básicos
Terminología: Individuos/Población/Variables/Muestras
Por extraño que parezca, a menudo es una falta de claridad sobre a quién [o qué] estás mirando lo que hace mentira a partir de las estadísticas. Aquí están los términos, entonces, para seguir recto:
Las unidades que son objeto de un estudio estadístico se denominan los individuos en ese estudio, mientras que la colección de todos estos individuos se denomina población del estudio.
Tenga en cuenta que si bien el término “individuos” suena como si estuviera hablando de personas, los individuos en un estudio podrían ser cosas, incluso cosas abstractas como eventos.
Ejemplo 1.1.2. Los individuos en un estudio sobre una elección democrática podrían ser los votantes. Pero si vas a hacer una predicción precisa de quién ganará la elección, es importante ser más precisos sobre cuál es exactamente la población de todos esos individuos [votantes] que pretendes estudiar, pero es todos los votantes elegibles, todos los votantes registrados , las personas que realmente votaron, etc.
Ejemplo 1.1.3. Si quieres estudiar si una moneda es “justa” o no, la voltearías repetidamente. Los individuos serían entonces volteretas de esa moneda, y la población podría ser algo así como todos los giros que se hayan hecho en el pasado y todo lo que se hará cada uno en el futuro. Estos individuos son bastante abstractos, y de hecho es imposible jamás ponerlos en tus manos a todos ellos (los del futuro, por ejemplo).
Ejemplo 1.1.4. Supongamos que nos interesa estudiar si hacer más tareas ayuda a los estudiantes a mejorar sus estudios. Entonces, ¿no deberían ser los individuos los estudiantes? Bueno, ¿qué alumnos? ¿Qué tal si miramos solo a los estudiantes universitarios? ¿Qué estudiantes universitarios? Bien, ¿qué tal los estudiantes en colegios y universidades de 4 años en Estados Unidos, en los últimos cinco años? Después de todo, las cosas pueden ser diferentes en otros países y otros períodos históricos.
Espera, un estudiante en particular a veces puede hacer mucha tarea y a veces hacer muy poco. ¿Y qué significa exactamente “mejor en sus estudios”? Entonces tal vez deberíamos mirar a cada alumno en cada clase que toman, entonces podemos ver la tarea que hicieron para esa clase y el éxito que tuvieron en ella.
Por lo tanto, los individuos en este estudio serían experiencias individuales que los estudiantes de colegios y universidades estadounidenses de 4 años tuvieron en los últimos cinco años, y la población del estudio sería esencialmente la colección de todos los nombres en todas las listas de clases de cursos en los últimos cinco años en todos los colegios y universidades estadounidenses de 4 años.
Al hacer un estudio científico real, generalmente no nos interesan tanto los propios individuos, sino más bien en
Una variable en un estudio estadístico es la respuesta a una pregunta que el investigador hace sobre cada individuo. Hay dos tipos:
- Una variable categórica es aquella cuyos valores tienen un número finito de posibilidades.
- Una variable cuantitativa es aquella cuyos valores son números (entonces, potencialmente un número infinito de posibilidades).
La variable es algo que (como su nombre lo dice) varía, en el sentido de que puede tener un valor diferente para cada individuo en la población (aunque eso no es necesario).
Ejemplo 1.1.6 En el Ejemplo 1.1.2, la variable más probable sería por quién votaron, una variable categórica con solo valores posibles “Mickey Mouse” o “Duck Daffy” (o quienquiera que fueran los nombres en la boleta).
Ejemplo 1.1.7 En el Ejemplo 1.1.3, la variable más probable sería qué cara de la moneda estaba mirando hacia arriba después del volteo, una variable categórica con valores “cabezas” y “colas”.
Ejemplo 1.1.8 Hay varias variables que podríamos usar en el Ejemplo 1.1.4. Uno podría ser cuántos problemas con la tarea hizo el alumno en ese curso. Otra podría ser cuántas horas en total pasó el alumno haciendo la tarea durante todo ese semestre, para ese curso. Ambas serían variables cuantitativas.
Una variable categórica para una misma población sería qué calificación de letra obtuvo el alumno en el curso, que tiene posibles valores A, A-, B+,..., D-, F.
En muchos [¿la mayoría?] estudios interesantes, la población es demasiado grande para que sea práctico ir a observar los valores de alguna variable interesante. A veces no sólo es poco práctico, sino realmente imposible —piense en el ejemplo que dimos de todos los giros de la moneda, incluso en los del futuro. Entonces, en cambio, a menudo trabajamos con
Una muestra es un subconjunto de una población en estudio.
A menudo utilizamos la variableN para indicar el tamaño de una población entera y la variablen para el tamaño de una muestra; como hemos dicho, generalmenten<N.
Posteriormente discutiremos cómo elegir una buena muestra, y cuánto podemos aprender sobre una población observando los valores de una variable de interés solo para los individuos de una muestra. Para el resto de este capítulo, sin embargo, solo consideremos qué hacer con estos valores de muestra.