Saltar al contenido principal
LibreTexts Español

5.3: Tidyverse en acción

  • Page ID
    150543
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    \( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)

    ( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\id}{\mathrm{id}}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\kernel}{\mathrm{null}\,}\)

    \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\)

    \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\)

    \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    \( \newcommand{\vectorA}[1]{\vec{#1}}      % arrow\)

    \( \newcommand{\vectorAt}[1]{\vec{\text{#1}}}      % arrow\)

    \( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vectorC}[1]{\textbf{#1}} \)

    \( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)

    \( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)

    \( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)

    \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    Para ver el tidyverse en acción, limpiemos el conjunto de datos NHANES. Cada individuo en el conjunto de datos NHANES tiene un identificador único almacenado en el ID de variable. Primero veamos el número de filas en el conjunto de datos:

    nrow(NHANES)
    ## [1] 6779

    Ahora veamos cuántos ID únicos hay. La función unique () devuelve un vector que contiene todos los valores únicos para una variable en particular, y la función length () devuelve la longitud del vector resultante.

    length(unique(NHANES$ID))
    ## [1] 6779

    Esto nos muestra que si bien hay 10,000 observaciones en el marco de datos, solo hay 6779 IDs únicos. Esto significa que si tuviéramos que usar todo el conjunto de datos, estaríamos reutilizando datos de algunos individuos, lo que podría darnos resultados incorrectos. Por esta razón, nos gustaría descartar cualquier observación que se duplique.

    Vamos a crear una nueva variable llamada Nhanes_unique que contendrá sólo las observaciones distintas, sin que aparezcan individuos más de una vez. La biblioteca dplyr proporciona una función llamada distinto () que hará esto por nosotros. Puedes notar que no cargamos explícitamente la biblioteca dplyr anterior; sin embargo, si miras los mensajes que aparecieron cuando cargamos la biblioteca tidyverse, verás que cargó dplyr para nosotros. Para crear el nuevo marco de datos con observaciones únicas, canalizaremos el marco de datos NHANES a la función distinto () y luego guardaremos la salida en nuestra nueva variable.

    NHANES_unique <- 
      NHANES %>% 
      distinct(ID, .keep_all = TRUE)

    Si tenemos el número de filas en el nuevo marco de datos, debería ser el mismo que el número de ID únicos (6779):

    nrow(NHANES_unique)
    ## [1] 6779

    En el siguiente ejemplo verás que el poder de las tuberías cobra vida, cuando comenzamos a unir múltiples funciones en una sola operación (o “tubería”).


    This page titled 5.3: Tidyverse en acción is shared under a not declared license and was authored, remixed, and/or curated by Russell A. Poldrack via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.