Saltar al contenido principal
LibreTexts Español

3.8: Marcos de datos

  • Page ID
    150441
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    \( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)

    ( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\id}{\mathrm{id}}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\kernel}{\mathrm{null}\,}\)

    \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\)

    \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\)

    \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    \( \newcommand{\vectorA}[1]{\vec{#1}}      % arrow\)

    \( \newcommand{\vectorAt}[1]{\vec{\text{#1}}}      % arrow\)

    \( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vectorC}[1]{\textbf{#1}} \)

    \( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)

    \( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)

    \( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)

    \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    A menudo en un conjunto de datos tendremos una serie de variables diferentes con las que queremos trabajar. En lugar de tener una variable con nombre diferente que almacene cada una, a menudo es útil combinar todas las variables separadas en un solo paquete, que se conoce como un marco de datos.

    Si está familiarizado con una hoja de cálculo (digamos de Microsoft Excel) entonces ya tiene una comprensión básica de un marco de datos.
    Digamos que tenemos valores de precio y kilometraje para tres tipos diferentes de autos. Podríamos comenzar creando una variable para cada uno, asegurándonos de que los tres autos estén en el mismo orden para cada una de las variables:

    car_model <- c("Ford Fusion", "Hyundai Accent", "Toyota Corolla")
    car_price <- c(25000, 16000, 18000)
    car_mileage <- c(27, 36, 32)
    

    Luego podemos combinarlos en un solo marco de datos, usando la función data.frame (). Me gusta usar “_df” en los nombres de los marcos de datos solo para dejar claro que es un marco de datos, por lo que llamaremos a este “cars_df”:

    cars_df <- data.frame(model=car_model, price=car_price, mileage=car_mileage)
    

    Podemos ver el marco de datos usando la función View ():

    View(cars_df)

    La cual presentará una vista del marco de datos muy parecida a una hoja de cálculo, como se muestra en la Figura 2.1:

    Una vista del marco de datos de autos generado por la función View ().
    Figura 2.1: Una vista del marco de datos de autos generado por la función View ().

    Cada una de las columnas en el marco de datos contiene una de las variables, con el nombre que le dimos cuando creamos el marco de datos. Podemos acceder a cada una de esas columnas usando el operador $. Por ejemplo, si quisiéramos acceder a la variable kilometraje, combinaríamos el nombre del marco de datos con el nombre de la variable de la siguiente manera:

    > cars_df$mileage
    [1] 27 36 32
    

    Esto es como cualquier otro vector, en que podemos referirnos a sus valores individuales usando corchetes como hicimos con vectores regulares:

    > cars_df$mileage[3]
    [1] 32
    

    En algunos de los ejemplos del libro, verás algo llamado tibble; esto es básicamente una versión mejorada de un marco de datos, y se puede tratar principalmente de la misma manera.


    This page titled 3.8: Marcos de datos is shared under a CC BY-NC 2.0 license and was authored, remixed, and/or curated by Russell A. Poldrack via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.