2.5: Acceso a un marco de datos

Última actualización
Guardar como PDF

Page ID: 149810

$ \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } $

$ \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} $

$ \newcommand{\id}{\mathrm{id}}$ $ \newcommand{\Span}{\mathrm{span}}$

( \newcommand{\kernel}{\mathrm{null}\,}\) $ \newcommand{\range}{\mathrm{range}\,}$

$ \newcommand{\RealPart}{\mathrm{Re}}$ $ \newcommand{\ImaginaryPart}{\mathrm{Im}}$

$ \newcommand{\Argument}{\mathrm{Arg}}$ $ \newcommand{\norm}[1]{\| #1 \|}$

$ \newcommand{\inner}[2]{\langle #1, #2 \rangle}$

$ \newcommand{\Span}{\mathrm{span}}$

$ \newcommand{\id}{\mathrm{id}}$

$ \newcommand{\Span}{\mathrm{span}}$

$ \newcommand{\kernel}{\mathrm{null}\,}$

$ \newcommand{\range}{\mathrm{range}\,}$

$ \newcommand{\RealPart}{\mathrm{Re}}$

$ \newcommand{\ImaginaryPart}{\mathrm{Im}}$

$ \newcommand{\Argument}{\mathrm{Arg}}$

$ \newcommand{\norm}[1]{\| #1 \|}$

$ \newcommand{\inner}[2]{\langle #1, #2 \rangle}$

$ \newcommand{\Span}{\mathrm{span}}$ $ \newcommand{\AA}{\unicode[.8,0]{x212B}}$

$ \newcommand{\vectorA}[1]{\vec{#1}} % arrow$

$ \newcommand{\vectorAt}[1]{\vec{\text{#1}}} % arrow$

$ \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } $

$ \newcommand{\vectorC}[1]{\textbf{#1}} $

$ \newcommand{\vectorD}[1]{\overrightarrow{#1}} $

$ \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} $

$ \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} $

$ \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } $

$ \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} $

Accedemos a los elementos individuales en un marco de datos usando corchetes para identificar una celda específica. Por ejemplo, lo siguiente accede a los datos de la celda en la fila 15, columna 12:

> int92.dat[15,12] 
[1] 180

También podemos acceder a las celdas por nombre poniendo comillas alrededor del nombre:

 > int92.dat["71","perf"] 
 [1] 105.1

Esta expresión devuelve los datos en la fila etiquetada 71 y la columna etiquetada perf. Tenga en cuenta que esta no es la fila 71, sino la fila que contiene los datos para el procesador cuyo nombre es 71.

Podemos acceder a una columna entera dejando vacío el primer parámetro entre corchetes. Por ejemplo, lo siguiente imprime el valor en cada fila para la columna etiquetada reloj:

> int92.dat[,"clock"]
[1] 100 125 166 175 190 ...

Del mismo modo, esta expresión imprime los valores en todas las columnas de la fila 36:

> int92.dat[36,]
nperf perf clock threads cores ... 
36 13.07378 79.86399 80 1 1 ...

Las funciones nrow () y ncol () devuelven el número de filas y columnas, respectivamente, en el marco de datos:

> nrow(int92.dat) 
[1] 78
> ncol(int92.dat) 
[1] 16

Debido a que las funciones R normalmente pueden operar en un vector de cualquier longitud, podemos usar funciones integradas para calcular rápidamente algunos resultados útiles. Por ejemplo, las siguientes expresiones computan el mínimo, el máximo, la media y la desviación estándar de la columna perf en el marco de datos int92.dat:

> min(int92.dat[,"perf"]) 
[1] 36.7
> max(int92.dat[,"perf"]) 
[1] 366.857
> mean(int92.dat[,"perf"]) 
[1] 124.2859
> sd(int92.dat[,"perf"]) 
[1] 78.0974

Esta notación de corchetes cuadrados puede volverse engorrosa cuando se realiza una cantidad sustancial de computación interactiva dentro del entorno R. R proporciona una notación alternativa usando el símbolo $ para acceder más fácilmente a una columna. Repitiendo el ejemplo anterior usando esta notación:

> min(int92.dat$perf) 
[1] 36.7
> max(int92.dat$perf) 
[1] 366.857
> mean(int92.dat$perf) 
[1] 124.2859
> sd(int92.dat$perf) 
[1] 78.0974

Esta notación dice usar los datos en la columna llamada perf del marco de datos llamado int92.dat. Podemos hacer una simplificación adicional usando la función attach. Esta función hace que el marco de datos correspondiente sea local al espacio de trabajo actual, eliminando así la necesidad de usar la notación de indexación $ o corchetes cuadrados potencialmente incómoda. El siguiente ejemplo muestra cómo funciona esto:

> attach(int92.dat) 
> min(perf)
[1] 36.7
> max(perf) 
[1] 366.857 
> mean(perf) 
[1] 124.2859 
> sd(perf) 
[1] 78.0974

Para cambiar a un marco de datos diferente dentro de su espacio de trabajo local, primero debe desacoplar el marco de datos actual:

> detach(int92.dat) 
> attach(fp00.dat) 
> min(perf)
[1] 87.54153
> max(perf) 
[1] 3369
> mean(perf) 
[1] 1217.282 
> sd(perf) 
[1] 787.4139

Ahora que tenemos los datos necesarios disponibles en el entorno R, y algo de comprensión de cómo acceder y manipular estos datos, estamos listos para generar nuestro primer modelo de regresión.

Search

Text Color

Text Size

Margin Size

Font Type