2.3: Muestra de tallo y hoja
- Page ID
- 152211
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)
( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\id}{\mathrm{id}}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\kernel}{\mathrm{null}\,}\)
\( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\)
\( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\)
\( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)
\( \newcommand{\vectorA}[1]{\vec{#1}} % arrow\)
\( \newcommand{\vectorAt}[1]{\vec{\text{#1}}} % arrow\)
\( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vectorC}[1]{\textbf{#1}} \)
\( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)
\( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)
\( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\(\newcommand{\avec}{\mathbf a}\) \(\newcommand{\bvec}{\mathbf b}\) \(\newcommand{\cvec}{\mathbf c}\) \(\newcommand{\dvec}{\mathbf d}\) \(\newcommand{\dtil}{\widetilde{\mathbf d}}\) \(\newcommand{\evec}{\mathbf e}\) \(\newcommand{\fvec}{\mathbf f}\) \(\newcommand{\nvec}{\mathbf n}\) \(\newcommand{\pvec}{\mathbf p}\) \(\newcommand{\qvec}{\mathbf q}\) \(\newcommand{\svec}{\mathbf s}\) \(\newcommand{\tvec}{\mathbf t}\) \(\newcommand{\uvec}{\mathbf u}\) \(\newcommand{\vvec}{\mathbf v}\) \(\newcommand{\wvec}{\mathbf w}\) \(\newcommand{\xvec}{\mathbf x}\) \(\newcommand{\yvec}{\mathbf y}\) \(\newcommand{\zvec}{\mathbf z}\) \(\newcommand{\rvec}{\mathbf r}\) \(\newcommand{\mvec}{\mathbf m}\) \(\newcommand{\zerovec}{\mathbf 0}\) \(\newcommand{\onevec}{\mathbf 1}\) \(\newcommand{\real}{\mathbb R}\) \(\newcommand{\twovec}[2]{\left[\begin{array}{r}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\ctwovec}[2]{\left[\begin{array}{c}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\threevec}[3]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\cthreevec}[3]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\fourvec}[4]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\cfourvec}[4]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\fivevec}[5]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\cfivevec}[5]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\mattwo}[4]{\left[\begin{array}{rr}#1 \amp #2 \\ #3 \amp #4 \\ \end{array}\right]}\) \(\newcommand{\laspan}[1]{\text{Span}\{#1\}}\) \(\newcommand{\bcal}{\cal B}\) \(\newcommand{\ccal}{\cal C}\) \(\newcommand{\scal}{\cal S}\) \(\newcommand{\wcal}{\cal W}\) \(\newcommand{\ecal}{\cal E}\) \(\newcommand{\coords}[2]{\left\{#1\right\}_{#2}}\) \(\newcommand{\gray}[1]{\color{gray}{#1}}\) \(\newcommand{\lgray}[1]{\color{lightgray}{#1}}\) \(\newcommand{\rank}{\operatorname{rank}}\) \(\newcommand{\row}{\text{Row}}\) \(\newcommand{\col}{\text{Col}}\) \(\renewcommand{\row}{\text{Row}}\) \(\newcommand{\nul}{\text{Nul}}\) \(\newcommand{\var}{\text{Var}}\) \(\newcommand{\corr}{\text{corr}}\) \(\newcommand{\len}[1]{\left|#1\right|}\) \(\newcommand{\bbar}{\overline{\bvec}}\) \(\newcommand{\bhat}{\widehat{\bvec}}\) \(\newcommand{\bperp}{\bvec^\perp}\) \(\newcommand{\xhat}{\widehat{\xvec}}\) \(\newcommand{\vhat}{\widehat{\vvec}}\) \(\newcommand{\uhat}{\widehat{\uvec}}\) \(\newcommand{\what}{\widehat{\wvec}}\) \(\newcommand{\Sighat}{\widehat{\Sigma}}\) \(\newcommand{\lt}{<}\) \(\newcommand{\gt}{>}\) \(\newcommand{\amp}{&}\) \(\definecolor{fillinmathshade}{gray}{0.9}\)Objetivos de aprendizaje
- Crear e interpretar exhibiciones básicas de tallos y hojas
- Crear e interpretar pantallas de tallo y hojas consecutivas
- Juzgar si una visualización de tallo y hoja es apropiada para un conjunto de datos dado
Una visualización de tallo y hoja es un método gráfico de visualización de datos. Es particularmente útil cuando sus datos no son demasiado numerosos. En esta sección, explicaremos cómo construir e interpretar este tipo de gráficas.
Como es habitual, un ejemplo nos va a poner en marcha. Considera Tabla\(\PageIndex{1}\) que muestra el número de pases de touchdown (pases TD) lanzados por cada uno de los\(31\) equipos en la Liga Nacional de Futbol en la\(2000\) temporada.
Tabla\(\PageIndex{1}\): Número de pases de touchdown
\[\begin{matrix} 37 & 33 & 33 & 32 & 29 & 28 & 28 & 23 & 22\\ 22 & 22 & 21 & 21 & 21 & 20 & 20 & 19 & 19\\ 18 & 18 & 18 & 18 & 16 & 15 & 14 & 14 & 14\\ 12 & 12 & 9 & 6 & & & & & \end{matrix}\]
En la Figura se muestra una visualización de tallo y hoja de los datos\(\PageIndex{1}\). La porción izquierda de la Figura\(\PageIndex{1}\) contiene los tallos. Son los números\(3, 2, 1,\; and\; 0\), dispuestos como una columna a la izquierda de las barras. Piense en estos números como\(10’s\) dígitos. Un tallo de\(3\), por ejemplo, se puede utilizar para representar el\(10’s\) dígito en cualquiera de los números de\(30\) a\(39\). Los números a la derecha de la barra son hojas, y representan los\(1’s\) dígitos. Por lo tanto, cada hoja en la gráfica representa el resultado de agregar la hoja a\(10\) veces su tallo.
\[\begin{array}{c|c c c c c c c c c c c c c} 3 &2 &3 &3 &7\\ 2 &0 &0 &1 &1 &1 &2 &2 &2 &3 &8 &8 &9\\ 1 &2 &2 &4 &4 &4 &5 &6 &8 &8 &8 &8 &9 &9\\ 0 &6 &9\\ \end{array}\]
Figura\(\PageIndex{1}\): Visualización de tallo y hoja del número de pases de touchdown
Para dejar esto claro, examinemos Figura\(\PageIndex{1}\) más de cerca. En la fila superior, se\(3\) encuentran las cuatro hojas a la derecha del tallo\(2, 3, 3,\; and\; 7\). Combinadas con el tallo, estas hojas representan los números\(32, 33, 33,\; and\; 37\), que son los números de pases TD para los cuatro primeros equipos de la Tabla\(\PageIndex{1}\). La siguiente fila tiene un tallo de\(2\) y\(12\) hojas. Juntos, representan puntos de\(12\) datos, a saber, dos ocurrencias de pases\(20\) TD, tres ocurrencias de pases\(21\) TD, tres ocurrencias de pases\(22\) TD, una ocurrencia de pases\(23\) TD, dos ocurrencias de pases\(28\) TD y una ocurrencia de\(29\) TD pasa. Te dejamos a ti averiguar qué representa la tercera fila. La cuarta fila tiene un tallo de\(0\) y dos hojas. Se refiere a las dos últimas entradas en la Tabla\(\PageIndex{1}\), a saber, pases\(9\) TD y pases\(6\) TD. (Los dos últimos números pueden considerarse como\(09\) y\(06\).)
Un propósito de una exhibición de tallo y hoja es aclarar la forma de la distribución. Se pueden ver muchos datos sobre los pases TD más fácilmente en la Figura\(\PageIndex{1}\) que en la Tabla\(\PageIndex{1}\). Por ejemplo, al mirar los tallos y la forma de la trama, se puede decir que la mayoría de los equipos tenían\(10\) TD entre y\(29\) pases, con unos pocos teniendo más y algunos teniendo menos. Los números precisos de pases TD se pueden determinar examinando las hojas.
Podemos hacer que nuestra figura sea aún más reveladora dividiendo cada tallo en dos partes. La figura\(\PageIndex{2}\) muestra cómo hacerlo. La fila superior está reservada para números de\(35\) a\(39\) y solo contiene los pases\(37\) TD realizados por el primer equipo en la Tabla\(\PageIndex{1}\). La segunda fila está reservada para los números de\(30\) a\(34\) y sostiene los pases\(32, 33,\; and\; 33\) TD realizados por los siguientes tres equipos en la tabla. Puedes ver por ti mismo lo que representan las otras filas.
\[\begin{array}{c|c c c c c c c c c c c c c} 3 &7\\ 3 &2 &3 &3 \\ 2 &8 &8 &9 \\ 2 &0 &0 &1 &1 &1 &2 &2 &2 &3 \\ 1 &5 &6 &8 &8 &8 &8 &9 &9\\ 1 &2 &2 &4 &4 &4 \\ 0 &6 &9 \end{array}\]
Figura\(\PageIndex{2}\): Visualización de tallo y hoja con los tallos divididos en dos
La figura\(\PageIndex{2}\) es más reveladora que la figura\(1PageIndex{2}\) porque esta última figura agrupa demasiados valores en una sola fila. Si debe dividir los tallos en una pantalla depende de la forma exacta de sus datos. Si las filas se alargan demasiado con tallos individuales, podrías intentar dividirlas en dos o más partes.
Existe una variación de las pantallas de tallo y hoja que es útil para comparar distribuciones. Las dos distribuciones se colocan espalda con espalda a lo largo de una columna común de tallos. El resultado es una “gráfica de tallo y hoja consecutiva”. La figura\(\PageIndex{3}\) muestra dicha gráfica. Compara los números de pases TD en las\(2000\) temporadas\(1998\) y. Los tallos están en el medio, las hojas a la izquierda son para los\(1998\) datos y las hojas a la derecha son para los\(2000\) datos. Por ejemplo, la penúltima fila muestra que en 1998 hubo equipos con pases\(11, 12,\; and\; 13\) TD, y en\(2000\) había dos equipos con\(12\) y tres equipos con pases\(14\) TD.
\[\begin{array}{c|c|c c c c c c c c c c} \; \; \; \; \; \; \; \; \; \; \; \; \; \; \; \; \; \; \; 1\; 1 & 4 \\ &3 &7\\ \; \; \; \; \; \; \; \; \; \; \; \; \; \; \; \; 3\; 3\; 2 &3 &2 &3 &3\\ \; \; \; \; \; \; \; \; \; \; \; \; \; 8\; 8\; 6\; 5 &2 &8 &8 &9\\ \; \; 4\; 4\; 3\; 3\; 1\; 1\; 1\; 0 &2 &0 &0 &1 &1 &1 &2 &2 &2 &3\\ 9\; 8\; 7\; 7\; 7\; 6\; 6\; 6\; 5 &1 &5 &6 &8 &8 &8 &8 &9 &9\\ \; \; \; \; \; \; \; \; \; \; \; \; \; \; \; \; \; 3\; 2\; 1 &1 &2 &2 &4 &4 &4 &4\\ \; \; \; \; \; \; \; \; \; \; \; \; \; \; \; \; \; \; \; \; \; \; \; 7 &0 &6 &9 \end{array}\]
Figura\(\PageIndex{3}\): Visualización de tallo y hoja espalda con espalda.
El lado izquierdo muestra los datos\(1998\) TD y el lado derecho muestra los datos\(2000\) TD. La figura nos\(\PageIndex{3}\) ayuda a ver que las dos temporadas fueron similares, pero que sólo en algún equipo\(1998\) arrojó más que pases\(40\) TD.
Hay dos cosas sobre los datos futbolísticos que hacen que sean fáciles de graficar con tallos y hojas. Primero, los datos se limitan a números enteros que se pueden representar con un tallo de un dígito y una hoja de un dígito. Segundo, todos los números son positivos. Si los datos incluyen números con tres o más dígitos, o contienen decimales, se pueden redondear a una precisión de dos dígitos. Los valores negativos también se manejan fácilmente. Veamos otro ejemplo.
En la tabla se\(\PageIndex{2}\) muestran datos del estudio de caso Armas y agresión. Cada valor es la diferencia media a lo largo de una serie de ensayos entre las veces que tomó a un sujeto experimental nombrar palabras agresivas (como “punch”) bajo dos condiciones. En una condición, las palabras fueron precedidas por una palabra no arma como “bug”. En la segunda condición, las mismas palabras fueron precedidas por una palabra arma como “arma” o “cuchillo”. El tema abordado por el experimento fue si una palabra arma precedente aceleraría (o cebaría) la pronunciación de la palabra agresiva en comparación con una palabra que no es de imprimación de arma. Una diferencia positiva implica un mayor cebado de la palabra agresiva por la palabra arma. Las diferencias negativas implican que el cebado por la palabra arma fue menor que para una palabra neutra.
Tabla\(\PageIndex{2}\): Los efectos del cebado (milésimas de segundo)
\[\begin{matrix} 43.2 & 42.9 & 35.6 & 25.6 & 25.4 & 23.6 & & \\ 20.5 & 19.9 & 14.4 & 12.7 & 11.3 & 10.2 & & \\ 10.0 & 9.1 & 7.5 & 5.4 & 4.7 & 3.8 & 2.1 & 1.2\\ -0.2 & -6.3 & -6.7 & -8.8 & -10.4 & -10.5 & & \\ -14.9 & -14.9 & -15.0 & -18.5 & -27.4 \end{matrix}\]
Ves que los números van desde\(43.2\) hasta\(-27.4\). El primer valor indica que un sujeto fue\(43.2\) milisegundos más rápido pronunciando palabras agresivas cuando fueron precedidas por palabras de arma que cuando precedieron por palabras neutrales. El valor\(-27.4\) indica que otro sujeto fue\(27.4\) milisegundos más lento pronunciando palabras agresivas cuando fueron precedidas por palabras de arma.
Los datos se muestran con tallos y hojas en la Figura\(\PageIndex{4}\). Dado que las exhibiciones de tallo y hoja solo pueden representar dos dígitos enteros (uno para el tallo y otro para la hoja), los números se redondean primero. Así, el valor\(43.2\) se redondea\(43\) y se representa con un tallo de\(4\) y una hoja de\(3\). Del mismo modo,\(42.9\) se redondea a\(43\). Para representar números negativos, simplemente usamos tallos negativos. Por ejemplo, la fila inferior de la figura representa el número\(-27\). La penúltima fila representa los números\(-10, -10, -15\), etc. Una vez más, hemos redondeado los valores originales de Table\(\PageIndex{2}\).
\[\begin{array}{c|c c c c c c c} 4 & 3 & 3 \\ 3 &6 \\ 2 &0 &0 &4 &5 &6\\ 1 &0 &0 &1 &3 &4\\ 0 &1 &2 &4 &5 &5 &8 &9\\ -0 &0 &6 &7 &9\\ -1 &0 &0 &5 &5 &5 &9\\ -2 &7 \end{array}\]
Figura\(\PageIndex{4}\): Visualización de tallo y hoja con números negativos y redondeo
Observe que la figura contiene una fila encabezada por "\(0\)" y otra encabezada por "\(-0\)”. El tallo de\(0\) es para números entre\(0\) y\(9\), mientras que el tallo de\(-0\) es para números entre\(0\) y\(-9\). Por ejemplo, la quinta fila de la tabla contiene los números\(1, 2, 4, 5, 5, 8, 9\) y la sexta fila sostiene\(0, -6, -7,\; and\; -9\). Los valores que están exactamente\(0\) antes del redondeo deben dividirse lo más uniformemente posible entre las filas\(0\) "" y\(-0\) "”. En la Tabla\(\PageIndex{2}\), ninguno de los valores se encuentra\(0\) antes del redondeo. El "\(0\)" que aparece en la fila\(-0\) ""” proviene del valor original de\(-0.2\) en la tabla.
Aunque las presentaciones de tallos y hojas son difíciles de manejar para grandes conjuntos de datos, a menudo son útiles para conjuntos de datos con hasta\(200\) observaciones. La figura\(\PageIndex{5}\) retrata la distribución de las poblaciones de ciudades de\(185\) Estados Unidos en\(1998\). Para ser incluido, una ciudad tenía que tener entre\(100,000\) y\(500,000\) residentes.
\[\begin{array}{c|ccccccccccccccccccccccccccccccccccccccccccc} 4 &8 &9 &9 \\ 4 &6 \\ 4 &4 &4 &5 &5\\ 4 &3 &3 &3\\ 4 &0 &1\\ 3 &9 &9\\ 3 &6 &7 &7 &7 &7 &7\\ 3 &5 &5\\ 3 &2 &2 &3\\ 3 &1 &1 &1\\ 2 &8 &8 &9 &9\\ 2 &6 &6 &6 &6 &6 &7\\ 2 &4 &4 &4 &4 &5 &5\\ 2 &2 &2 &3 &3 &3\\ 2 &0 &0 &0 &0 &0 &0\\ 1 &8 &8 &8 &8 &8 &8 &8 &8 &8 &8 &8 &8 &9 &9 &9 &9 &9 &9 &9 &9 &9 &9 &9\\ 1 &6 &6 &6 &6 &6 &6 &7 &7 &7 &7 &7 &7\\ 1 &4 &4 &4 &4 &4 &4 &4 &4 &4 &4 &4 &4 &5 &5 &5 &5 &5 &5 &5 &5 &5 &5 &5 &5\\ 1 &2 &2 &2 &2 &2 &2 &2 &2 &2 &2 &2 &2 &2 &2 &2 &2 &2 &2 &2 &3 &3 &3 &3 &3 &3 &3 &3 &3\\ 1 &0 &0 &0 &0 &0 &0 &0 &0 &0 &0 &0 &0 &0 &0 &0 &1 &1 &1 &1 &1 &1 &1 &1 &1 &1 &1 &1 &1 &1 &1 &1 &1 &1 &1 &1 &1 &1 &1 &1 &1 &1 &1 \end{array}\]
Figura\(\PageIndex{5}\): Visualización de tallos y hojas de poblaciones de ciudades de\(185\) Estados Unidos con poblaciones entre\(100,000\) y\(500,000\) en\(1998\).
Dado que una parcela de tallo y hoja muestra solo una precisión de dos lugares, tuvimos que redondear los números al más cercano\(10,000\). Por ejemplo, el mayor número (\(493,559\)) se redondeó\(490,000\) y luego se trazó con un tallo de\(4\) y una hoja de\(9\). El cuarto número más alto (\(463,201\)) se redondeó\(460,000\) y se trazó con un tallo de\(4\) y una hoja de\(6\). Así, los tallos representan unidades de\(100,000\) y las hojas representan unidades de\(10,000\). Observe que cada valor de tallo se divide en cinco partes:\(0-1, 2-3, 4-5, 6-7\), y\(8-9\).
Si sus datos pueden ser adecuadamente representados por un gráfico de tallo y hoja depende de si se pueden redondear sin pérdida de información importante. Además, sus valores extremos deben encajar en dos dígitos sucesivos, ya que los datos de la Figura\(\PageIndex{5}\) encajan en los\(100,000\) lugares\(10,000\) y (para hojas y tallos, respectivamente). Decidir qué tipo de gráfico es el más adecuado para mostrar sus datos, por lo tanto, requiere un buen juicio. ¡La estadística no es solo recetas!