Saltar al contenido principal
LibreTexts Español

2.5: Acceso a un marco de datos

  • Page ID
    149810
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    \( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)

    ( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\id}{\mathrm{id}}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\kernel}{\mathrm{null}\,}\)

    \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\)

    \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\)

    \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    \( \newcommand{\vectorA}[1]{\vec{#1}}      % arrow\)

    \( \newcommand{\vectorAt}[1]{\vec{\text{#1}}}      % arrow\)

    \( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vectorC}[1]{\textbf{#1}} \)

    \( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)

    \( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)

    \( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)

    \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    Accedemos a los elementos individuales en un marco de datos usando corchetes para identificar una celda específica. Por ejemplo, lo siguiente accede a los datos de la celda en la fila 15, columna 12:

    > int92.dat[15,12] 
    [1] 180

    También podemos acceder a las celdas por nombre poniendo comillas alrededor del nombre:

     > int92.dat["71","perf"] 
     [1] 105.1

    Esta expresión devuelve los datos en la fila etiquetada 71 y la columna etiquetada perf. Tenga en cuenta que esta no es la fila 71, sino la fila que contiene los datos para el procesador cuyo nombre es 71.

    Podemos acceder a una columna entera dejando vacío el primer parámetro entre corchetes. Por ejemplo, lo siguiente imprime el valor en cada fila para la columna etiquetada reloj:

    > int92.dat[,"clock"]
    [1] 100 125 166 175 190 ...

    Del mismo modo, esta expresión imprime los valores en todas las columnas de la fila 36:

    > int92.dat[36,]
    nperf perf clock threads cores ... 
    36 13.07378 79.86399 80 1 1 ...

    Las funciones nrow () y ncol () devuelven el número de filas y columnas, respectivamente, en el marco de datos:

    > nrow(int92.dat) 
    [1] 78
    > ncol(int92.dat) 
    [1] 16

    Debido a que las funciones R normalmente pueden operar en un vector de cualquier longitud, podemos usar funciones integradas para calcular rápidamente algunos resultados útiles. Por ejemplo, las siguientes expresiones computan el mínimo, el máximo, la media y la desviación estándar de la columna perf en el marco de datos int92.dat:

    > min(int92.dat[,"perf"]) 
    [1] 36.7
    > max(int92.dat[,"perf"]) 
    [1] 366.857
    > mean(int92.dat[,"perf"]) 
    [1] 124.2859
    > sd(int92.dat[,"perf"]) 
    [1] 78.0974

    Esta notación de corchetes cuadrados puede volverse engorrosa cuando se realiza una cantidad sustancial de computación interactiva dentro del entorno R. R proporciona una notación alternativa usando el símbolo $ para acceder más fácilmente a una columna. Repitiendo el ejemplo anterior usando esta notación:

    > min(int92.dat$perf) 
    [1] 36.7
    > max(int92.dat$perf) 
    [1] 366.857
    > mean(int92.dat$perf) 
    [1] 124.2859
    > sd(int92.dat$perf) 
    [1] 78.0974

    Esta notación dice usar los datos en la columna llamada perf del marco de datos llamado int92.dat. Podemos hacer una simplificación adicional usando la función attach. Esta función hace que el marco de datos correspondiente sea local al espacio de trabajo actual, eliminando así la necesidad de usar la notación de indexación $ o corchetes cuadrados potencialmente incómoda. El siguiente ejemplo muestra cómo funciona esto:

    > attach(int92.dat) 
    > min(perf)
    [1] 36.7
    > max(perf) 
    [1] 366.857 
    > mean(perf) 
    [1] 124.2859 
    > sd(perf) 
    [1] 78.0974

    Para cambiar a un marco de datos diferente dentro de su espacio de trabajo local, primero debe desacoplar el marco de datos actual:

    > detach(int92.dat) 
    > attach(fp00.dat) 
    > min(perf)
    [1] 87.54153
    > max(perf) 
    [1] 3369
    > mean(perf) 
    [1] 1217.282 
    > sd(perf) 
    [1] 787.4139

    Ahora que tenemos los datos necesarios disponibles en el entorno R, y algo de comprensión de cómo acceder y manipular estos datos, estamos listos para generar nuestro primer modelo de regresión.


    This page titled 2.5: Acceso a un marco de datos is shared under a CC BY-NC 4.0 license and was authored, remixed, and/or curated by David Lilja (University of Minnesota Libraries Publishing) via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.