7.1: La gramática de los gráficos
- Page ID
- 150807
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)
( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\id}{\mathrm{id}}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\kernel}{\mathrm{null}\,}\)
\( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\)
\( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\)
\( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)
\( \newcommand{\vectorA}[1]{\vec{#1}} % arrow\)
\( \newcommand{\vectorAt}[1]{\vec{\text{#1}}} % arrow\)
\( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vectorC}[1]{\textbf{#1}} \)
\( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)
\( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)
\( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
o, el “gg” en ggplot
Cada idioma tiene una gramática que consiste en tipos de palabras y las reglas con las que armarlas en oraciones. Si una oración es gramaticalmente correcta, podemos compararla, aunque eso no asegura que sea interesante, hermosa o incluso significativa.
De igual manera, las parcelas se pueden dividir en sus componentes centrales, que se unen a través de un conjunto de reglas.
Algunos de los componentes principales son:
- datos
- estética
- geometrías
- temas
Los datos son las variables reales que estamos trazando, que pasamos a ggplot a través del argumento data. Como ya has aprendido, ggplot toma un marco de datos en el que cada columna es una variable.
Ahora necesitamos decirle a ggplot cómo trazar esas variables, mapeando cada variable a un eje de la gráfica. Ya has visto que cuando trazamos histogramas, nuestra variable va sobre el eje x. Por lo tanto, establecemos x=
<variable>en una llamada a aes ()
dentro de ggplot ()
. Esto establece la estética, que son mapeos de datos a ciertas escalas, como ejes o cosas como color o forma. La trama aún tenía dos ejes —x e y— pero no necesitábamos especificar qué pasaba en el eje y porque ggplot sabía por defecto que debía hacer una variable count.
¿Cómo fue ggplot capaz de averiguarlo? Debido a las geometrías, que son formas que usamos para representar nuestros datos. Ya has visto geom_histograma
, que básicamente le da a nuestra gráfica una forma de gráfico de barras, excepto que también establece la variable del eje y predeterminada para ser count
. Otras formas incluyen puntos y líneas, entre muchas otras.
Repasaremos otros aspectos de la gramática de los gráficos (suxh como facetas, estadísticas y coordenadas) a medida que surjan. Comencemos a visualizar algunos datos eligiendo primero un tema, que describe toda la tinta que no es de datos en nuestra trama, como líneas de cuadrícula y texto.