CO-1: Describir los roles que la bioestadística desempeña en la disciplina de la salud pública.
Antes de saltar al Análisis Exploratorio de Datos, y realmente apreciar su importancia en el proceso de análisis estadístico, demos un paso atrás por un minuto y preguntemos:
¿Qué queremos decir realmente con datos?
Objetivos de aprendizaje
LO 1.4: Definir términos básicos respecto a los datos y reconocer variaciones comunes en la terminología.
Los datos son piezas de información sobre individuos organizados en variables.
- Por individuo, nos referimos a una persona u objeto en particular.
- Por una variable, nos referimos a una característica particular del individuo.
Un conjunto de datos es un conjunto de datos identificados con un experimento, escenario o circunstancia particular.
Los datasets suelen mostrarse en tablas, en las que las filas representan individuos y las columnas representan variables.
EJEMPLO: Registros médicos
El siguiente conjunto de datos muestra las historias clínicas de una muestra de pacientes.

En este ejemplo,
- los individuos son pacientes,
- y las variables son Género, Edad, Peso, Altura, Tabaquismo y Raza.
Cada fila, entonces, nos da toda la información sobre un individuo en particular (en este caso, paciente), y cada columna nos da información sobre una característica particular de todos los pacientes.
Individuos, observaciones o casos
Nota
Las filas de un conjunto de datos (que representan individuos) también pueden llamarse observaciones, casos o una descripción específica de los individuos y el escenario.
Por ejemplo, si estuviéramos interesados en estudiar las vacunas contra la gripe en escolares de todo Estados Unidos, podríamos recopilar datos donde cada observación fuera un
- estudiante
- escuela
- distrito escolar
- ciudad
- condado
- estado
Cada uno de estos resultaría en una manera diferente de investigar preguntas sobre las vacunas contra la gripe en escolares.
Observaciones independientes
Nota
En nuestro curso, presentaremos métodos que pueden ser utilizados cuando las observaciones que se analizan son independientes entre sí. Si las observaciones (filas en nuestro conjunto de datos) no son independientes, se necesita un análisis más complejo.Violaciones claras de observaciones independientes ocurren cuando
- tenemos más de una fila para un individuo dado como si recogemos las mismas medidas en muchos momentos diferentes para individuos en nuestro estudio
- los individuos son emparejados o emparejados de alguna manera.
Al comenzar este curso, debes comenzar con una conciencia de los tipos de datos con los que trabajaremos y aprender a reconocer situaciones que son más complejas que las cubiertas en este curso.
Variables
Nota
Las columnas en un conjunto de datos (que representan variables) a menudo se agrupan y etiquetan por su papel en nuestro análisis.
Por ejemplo, en muchos estudios que involucran a personas, a menudo recolectamos variables demográficas como género, edad, raza, etnia, estado socioeconómico, estado civil y muchas más.
Nota
También se debe considerar el papel que juega una variable en nuestro análisis.
- En estudios en los que deseamos predecir una variable usando una o más de las variables restantes, la variable que deseamos predecir se denomina comúnmente la variable de respuesta, la variable de resultado o la variable dependiente.
- Cualquier variable que estemos usando para predecir o explicar diferencias en el resultado se denomina comúnmente una variable explicativa, una variable independiente, una variable predictora o una covariable.
Diversos Usos del Término INDEPENDIENTE en Estadística
Nota: La palabra “independiente” se utiliza en la estadística de numerosas maneras. Tenga cuidado de entender de qué manera se usan las palabras “independiente” o “independencia” (así como dependiente o dependencia) cuando las vea utilizadas en los materiales.
- Aquí hemos discutido observaciones independientes (también llamadas casos, individuos o sujetos).
- También hemos utilizado el término variable independiente como otro término para nuestras variables explicativas.
- Posteriormente aprenderemos las definiciones formales de probabilidad de eventos independientes y eventos dependientes.
- Y al comparar grupos definiremos muestras independientes y muestras dependientes.