Saltar al contenido principal
LibreTexts Español

6.1: Anatomía de una parcela

  • Page ID
    150503
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    El objetivo de trazar datos es presentar un resumen de un conjunto de datos en una presentación bidimensional (u ocasionalmente tridimensional). Nos referimos a las dimensiones como ejes — el eje horizontal se llama eje X y el eje vertical se llama eje Y. Podemos organizar los datos a lo largo de los ejes de una manera que resalte los valores de los datos. Estos valores pueden ser continuos o categóricos.

    Hay muchos tipos diferentes de parcelas que podemos utilizar, las cuales tienen diferentes ventajas y desventajas. Digamos que nos interesa caracterizar la diferencia de estatura entre hombres y mujeres en el conjunto de datos de NHANES. La Figura 6.3 muestra cuatro formas diferentes de trazar estos datos.

    1. El gráfico de barras en el panel A muestra la diferencia de medias, pero no nos muestra cuánta dispersión hay en los datos alrededor de estos medios —y como veremos más adelante, saber esto es esencial para determinar si creemos que la diferencia entre los grupos es lo suficientemente grande como para ser importante.
    2. La segunda gráfica muestra las barras con todos los puntos de datos superpuestos, esto hace que sea un poco más claro que las distribuciones de estatura para hombres y mujeres se superponen, pero aún es difícil de ver debido a la gran cantidad de puntos de datos.

    En general preferimos utilizar una técnica de trazado que proporcione una visión más clara de la distribución de los puntos de datos.

    1. En el panel C, vemos un ejemplo de una trama de violín, que traza la distribución de los datos en cada condición (después de suavizarlo un poco).
    2. Otra opción es la gráfica de caja que se muestra en el panel D, que muestra la mediana (línea central), una medida de variabilidad (el ancho de la caja, que se basa en una medida llamada rango intercuartil), y cualquier valor atípica (anotado por los puntos en los extremos de las líneas). Ambas son formas efectivas de mostrar datos que proporcionan una buena sensación para la distribución de los datos.
    Cuatro formas diferentes de trazar la diferencia de estatura entre hombres y mujeres en el conjunto de datos NHANES. El Panel A traza las medias de los dos grupos, lo que no da forma de evaluar el solapamiento relativo de las dos distribuciones. El panel B muestra las mismas barras, pero también superpone los puntos de datos, nerviándolos para que podamos ver su distribución general. El Panel C muestra una gráfica de violín, que muestra la distribución de los conjuntos de datos para cada grupo. El Panel D muestra una gráfica de caja, que resalta la dispersión de la distribución junto con cualquier valor atímico (que se muestran como puntos individuales).
    Figura 6.3: Cuatro formas diferentes de trazar la diferencia de estatura entre hombres y mujeres en el conjunto de datos NHANES. El Panel A traza las medias de los dos grupos, lo que no da forma de evaluar el solapamiento relativo de las dos distribuciones. El panel B muestra las mismas barras, pero también superpone los puntos de datos, nerviándolos para que podamos ver su distribución general. El Panel C muestra una gráfica de violín, que muestra la distribución de los conjuntos de datos para cada grupo. El Panel D muestra una gráfica de caja, que resalta la dispersión de la distribución junto con cualquier valor atímico (que se muestran como puntos individuales).

    This page titled 6.1: Anatomía de una parcela is shared under a not declared license and was authored, remixed, and/or curated by Russell A. Poldrack via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.