Saltar al contenido principal
LibreTexts Español

2.1: ¿Qué son los datos?

  • Page ID
    150774
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    \( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)

    ( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\id}{\mathrm{id}}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\kernel}{\mathrm{null}\,}\)

    \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\)

    \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\)

    \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    \( \newcommand{\vectorA}[1]{\vec{#1}}      % arrow\)

    \( \newcommand{\vectorAt}[1]{\vec{\text{#1}}}      % arrow\)

    \( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vectorC}[1]{\textbf{#1}} \)

    \( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)

    \( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)

    \( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)

    \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    El primer punto importante sobre los datos es que los datos son - lo que significa que la palabra “datos” es plural (aunque algunas personas no están de acuerdo conmigo en esto). También podría preguntarse cómo pronunciar “data” — digo “day-tah” pero conozco a mucha gente que dice “dah-tah” y a pesar de esto he podido seguir siendo amigo de ellos. Ahora bien, si los oí decir “los datos son” entonces ese sería un tema mayor...

    2.1.1 Datos cualitativos

    Los datos están compuestos por variables, donde una variable refleja una medida o cantidad única. Algunas variables son cualitativas, lo que significa que describen una calidad más que una cantidad numérica. Por ejemplo, en mi curso de estadísticas generalmente doy una encuesta introductoria, tanto para obtener datos para usar en clase como para conocer más sobre los alumnos. Una de las preguntas que hago es “¿Cuál es tu comida favorita?” , a la que algunas de las respuestas han sido: arándanos, chocolate, tamales, pasta, pizza y mango. Esos datos no son intrínsecamente numéricos; podríamos asignar números a cada uno (1=arándanos, 2=chocolate, etc), pero solo estaríamos usando los números como etiquetas en lugar de como números reales; por ejemplo, no tendría sentido sumar los números juntos en este caso. Sin embargo, a menudo codificaremos datos cualitativos usando números para que sea más fácil trabajar con ellos, como verá más adelante.

    2.1.2 Datos cuantitativos

    Más comúnmente en estadística trabajaremos con datos cuantitativos, es decir, datos que son numéricos. Por ejemplo, aquí la Tabla 2.1 muestra los resultados de otra pregunta que hago en mi clase introductoria, que es “¿Por qué tomas esta clase?”

    Cuadro 2.1: Recuentos de la prevalencia de diferentes respuestas a la pregunta “¿Por qué tomas esta clase?”
    ¿Por qué vas a tomar esta clase? Número de alumnos
    Cumple con un requisito de plan de grado 105
    Cumple con un Requisito de Amplitud de Educación General 32
    No se requiere pero me interesa el tema 11
    Otros 4

    Tenga en cuenta que las respuestas de los estudiantes fueron cualitativas, pero generamos un resumen cuantitativo de las mismas contando cuántos estudiantes dieron cada respuesta.

    2.1.2.1 Tipos de números

    Hay varios tipos diferentes de números con los que trabajamos en estadística. Es importante entender estas diferencias, en parte porque lenguajes de programación como R a menudo distinguen entre ellas.

    Números binarios. Los más simples son los números binarios —es decir, cero o uno. A menudo usaremos números binarios para representar si algo es verdadero o falso, o presente o ausente. Por ejemplo, podría preguntar a 10 personas si alguna vez han experimentado un dolor de cabeza por migraña, registrando sus respuestas como “Sí” o “No”. A menudo es útil usar valores lógicos, que toman el valor de VERDADERO o FALSO. Podemos crearlos probando si cada valor es igual a “Sí”, lo que podemos hacer usando el símbolo ==. Esto devolverá el valor TRUE para cualquier valor coincidente de “Sí”, y FALSE en caso contrario. Estos son útiles para que R sepa interpretarlos de forma nativa, mientras que no sabe lo que significan “Sí” y “No”.

    En general, la mayoría de los lenguajes de programación tratan valores de verdad y números binarios de manera equivalente. El número 1 es igual al valor lógico VERDADERO, y el número cero es igual al valor lógico FALSE.

    Enteros. Los enteros son números enteros sin parte fraccionaria o decimal. Lo más común es que nos encontramos con números enteros cuando contamos las cosas, pero también suelen ocurrir en la medición psicológica. Por ejemplo, en mi encuesta introductoria administro un conjunto de preguntas sobre actitudes hacia la estadística (como “Las estadísticas me parecen muy misteriosas”), sobre las cuales los alumnos responden con un número entre 1 (“No estoy de acuerdo fuertemente”) y 7 (“De acuerdo fuertemente”).

    Números reales. Más comúnmente en estadística trabajamos con números reales, los cuales tienen una parte fraccional/decimal. Por ejemplo, podríamos medir el peso de alguien, que puede medirse a un nivel arbitrario de precisión, desde libras enteras hasta microgramos.


    This page titled 2.1: ¿Qué son los datos? is shared under a CC BY-NC 2.0 license and was authored, remixed, and/or curated by Russell A. Poldrack via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.