Saltar al contenido principal
LibreTexts Español

2.8: Recuerda mirar tus datos

  • Page ID
    150320
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    \( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)

    ( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\id}{\mathrm{id}}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\kernel}{\mathrm{null}\,}\)

    \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\)

    \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\)

    \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    \( \newcommand{\vectorA}[1]{\vec{#1}}      % arrow\)

    \( \newcommand{\vectorAt}[1]{\vec{\text{#1}}}      % arrow\)

    \( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vectorC}[1]{\textbf{#1}} \)

    \( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)

    \( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)

    \( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)

    \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    Las estadísticas descriptivas son geniales y las usaremos mucho en el curso para describir datos. Puede sospechar que las estadísticas descriptivas también tienen algunas fallas. Esto es muy cierto. Son resúmenes comprimidos de grandes montones de números. Casi siempre serán incapaces de representar todos los números de manera justa. También hay diferentes tipos de estadísticas descriptivas que podrías usar, y a veces no está claro cuál es la que debes usar.

    Quizás lo más importante que puedes hacer al usar descriptivos es usarlos en combinación con mirar los datos en forma de gráfico. Esto puede ayudarte a ver si tus descriptivos están haciendo o no un buen trabajo al representar los datos.

     

    Cuarteto de Anscombe

    Para llegar a este punto a casa, y para que pienses en los temas que discutimos en el siguiente capítulo, échale un vistazo a esto. Se llama Anscombe's Quartet, porque estas interesantes gráficas y números y números fueron producidos por Anscombe (1973). Estás viendo pares de medidas. Cada gráfica tiene un eje X e Y, y cada punto representa dos medidas. Cada una de las gráficas se ve muy diferente, ¿verdad?

    library(data.table)
    library(ggplot2)
    ac <- fread("https://stats.libretexts.org/@api/deki/files/10478/anscombe.txt")
    ac<-as.data.frame(ac)
    ac_long<-data.frame(x=c(ac[,1],
                            ac[,3],
                            ac[,5],
                            ac[,7]),
                        y=c(ac[,2],
                            ac[,4],
                            ac[,6],
                            ac[,8]),
                        quartet = as.factor(rep(1:4,each=11))
                            )
    ggplot(ac_long, aes(x=x, y=y, color=quartet))+
      geom_point()+
      theme_classic()+
      facet_wrap(~quartet)

    Bueno, ¿le sorprendería que le dijera que las estadísticas descriptivas de los números en estas gráficas son exactamente las mismas? Resulta que sí tienen las mismas estadísticas descriptivas. En la siguiente tabla presento la media y varianza para los valores x en cada gráfica, y la media y la varianza para los valores y en cada gráfica.

    cuarteto mean_x var_x mean_y var_y
    1 9 11 7.500909 4.127269
    2 9 11 7.500909 4.127629
    3 9 11 7.500000 4.122620
    4 9 11 7.500909 4.123249

    ¡Los descriptivos son todos iguales! Anscombe juntó estos números especiales para ilustrar el punto de graficar sus números. Si solo miras tus descriptivos, no sabes qué patrones en los datos están ocultando. Si miras la gráfica, entonces puedes obtener una mejor comprensión.

     

    Docena de Datasaurus

    Si pensabas que el cuarteto de Anscombe era pulcro, deberías echar un vistazo a la Docena de Datasaurus (Matejka y Fitzmaurice 2017). Desplácese hacia abajo para ver los ejemplos. Estarás mirando parcelas de puntos. Las parcelas de puntos muestran muchos patrones diferentes, ¡incluidos los dinosaurios! Lo sorprendente es que todos los puntos tienen casi las mismas estadísticas descriptivas. Solo otro recordatorio para mirar tus datos, ¡podría parecer un dinosaurio!


    This page titled 2.8: Recuerda mirar tus datos is shared under a CC BY-SA 4.0 license and was authored, remixed, and/or curated by Matthew J. C. Crump via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.