Saltar al contenido principal
LibreTexts Español

¿Qué es Data?

  • Page ID
    151223
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    CO-1: Describir los roles que la bioestadística desempeña en la disciplina de la salud pública.

    Antes de saltar al Análisis Exploratorio de Datos, y realmente apreciar su importancia en el proceso de análisis estadístico, demos un paso atrás por un minuto y preguntemos:

    ¿Qué queremos decir realmente con datos?

    Objetivos de aprendizaje

    LO 1.4: Definir términos básicos respecto a los datos y reconocer variaciones comunes en la terminología.

    Video

    ¿Qué es Data? (2:49)

    Los datos son piezas de información sobre individuos organizados en variables.

    • Por individuo, nos referimos a una persona u objeto en particular.
    • Por una variable, nos referimos a una característica particular del individuo.

    Un conjunto de datos es un conjunto de datos identificados con un experimento, escenario o circunstancia particular.

    Los datasets suelen mostrarse en tablas, en las que las filas representan individuos y las columnas representan variables.

    EJEMPLO: Registros médicos

    El siguiente conjunto de datos muestra las historias clínicas de una muestra de pacientes.

    Una tabla en la que las filas representan pacientes y cada columna representa una variable. Por ejemplo, la tercera fila es para el Paciente #3, y cada celda de la fila está en una columna en particular. La primera columna es Género, y el género del Paciente #3 es femenino, por lo que hay una 'F' en la primera columna de la tercera fila.

    En este ejemplo,

    • los individuos son pacientes,
    • y las variables son Género, Edad, Peso, Altura, Tabaquismo y Raza.

    Cada fila, entonces, nos da toda la información sobre un individuo en particular (en este caso, paciente), y cada columna nos da información sobre una característica particular de todos los pacientes.

    Individuos, observaciones o casos

    Nota

    Las filas de un conjunto de datos (que representan individuos) también pueden llamarse observaciones, casos o una descripción específica de los individuos y el escenario.

    Por ejemplo, si estuviéramos interesados en estudiar las vacunas contra la gripe en escolares de todo Estados Unidos, podríamos recopilar datos donde cada observación fuera un

    • estudiante
    • escuela
    • distrito escolar
    • ciudad
    • condado
    • estado

    Cada uno de estos resultaría en una manera diferente de investigar preguntas sobre las vacunas contra la gripe en escolares.

    Observaciones independientes

    Nota

    En nuestro curso, presentaremos métodos que pueden ser utilizados cuando las observaciones que se analizan son independientes entre sí. Si las observaciones (filas en nuestro conjunto de datos) no son independientes, se necesita un análisis más complejo.Violaciones claras de observaciones independientes ocurren cuando

    • tenemos más de una fila para un individuo dado como si recogemos las mismas medidas en muchos momentos diferentes para individuos en nuestro estudio
    • los individuos son emparejados o emparejados de alguna manera.

    Al comenzar este curso, debes comenzar con una conciencia de los tipos de datos con los que trabajaremos y aprender a reconocer situaciones que son más complejas que las cubiertas en este curso.

    Variables

    Nota

    Las columnas en un conjunto de datos (que representan variables) a menudo se agrupan y etiquetan por su papel en nuestro análisis.

    Por ejemplo, en muchos estudios que involucran a personas, a menudo recolectamos variables demográficas como género, edad, raza, etnia, estado socioeconómico, estado civil y muchas más.

    Nota

    También se debe considerar el papel que juega una variable en nuestro análisis.

    • En estudios en los que deseamos predecir una variable usando una o más de las variables restantes, la variable que deseamos predecir se denomina comúnmente la variable de respuesta, la variable de resultado o la variable dependiente.
    • Cualquier variable que estemos usando para predecir o explicar diferencias en el resultado se denomina comúnmente una variable explicativa, una variable independiente, una variable predictora o una covariable.

    Diversos Usos del Término INDEPENDIENTE en Estadística

    Nota: La palabra “independiente” se utiliza en la estadística de numerosas maneras. Tenga cuidado de entender de qué manera se usan las palabras “independiente” o “independencia” (así como dependiente o dependencia) cuando las vea utilizadas en los materiales.

    • Aquí hemos discutido observaciones independientes (también llamadas casos, individuos o sujetos).
    • También hemos utilizado el término variable independiente como otro término para nuestras variables explicativas.
    • Posteriormente aprenderemos las definiciones formales de probabilidad de eventos independientes y eventos dependientes.
    • Y al comparar grupos definiremos muestras independientes y muestras dependientes.

    ¿Qué es Data? is shared under a CC BY-NC-SA 4.0 license and was authored, remixed, and/or curated by LibreTexts.