1.3: Estadística Descriptiva
- Page ID
- 152479
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)
( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\id}{\mathrm{id}}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\kernel}{\mathrm{null}\,}\)
\( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\)
\( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\)
\( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)
\( \newcommand{\vectorA}[1]{\vec{#1}} % arrow\)
\( \newcommand{\vectorAt}[1]{\vec{\text{#1}}} % arrow\)
\( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vectorC}[1]{\textbf{#1}} \)
\( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)
\( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)
\( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\(\newcommand{\avec}{\mathbf a}\) \(\newcommand{\bvec}{\mathbf b}\) \(\newcommand{\cvec}{\mathbf c}\) \(\newcommand{\dvec}{\mathbf d}\) \(\newcommand{\dtil}{\widetilde{\mathbf d}}\) \(\newcommand{\evec}{\mathbf e}\) \(\newcommand{\fvec}{\mathbf f}\) \(\newcommand{\nvec}{\mathbf n}\) \(\newcommand{\pvec}{\mathbf p}\) \(\newcommand{\qvec}{\mathbf q}\) \(\newcommand{\svec}{\mathbf s}\) \(\newcommand{\tvec}{\mathbf t}\) \(\newcommand{\uvec}{\mathbf u}\) \(\newcommand{\vvec}{\mathbf v}\) \(\newcommand{\wvec}{\mathbf w}\) \(\newcommand{\xvec}{\mathbf x}\) \(\newcommand{\yvec}{\mathbf y}\) \(\newcommand{\zvec}{\mathbf z}\) \(\newcommand{\rvec}{\mathbf r}\) \(\newcommand{\mvec}{\mathbf m}\) \(\newcommand{\zerovec}{\mathbf 0}\) \(\newcommand{\onevec}{\mathbf 1}\) \(\newcommand{\real}{\mathbb R}\) \(\newcommand{\twovec}[2]{\left[\begin{array}{r}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\ctwovec}[2]{\left[\begin{array}{c}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\threevec}[3]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\cthreevec}[3]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\fourvec}[4]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\cfourvec}[4]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\fivevec}[5]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\cfivevec}[5]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\mattwo}[4]{\left[\begin{array}{rr}#1 \amp #2 \\ #3 \amp #4 \\ \end{array}\right]}\) \(\newcommand{\laspan}[1]{\text{Span}\{#1\}}\) \(\newcommand{\bcal}{\cal B}\) \(\newcommand{\ccal}{\cal C}\) \(\newcommand{\scal}{\cal S}\) \(\newcommand{\wcal}{\cal W}\) \(\newcommand{\ecal}{\cal E}\) \(\newcommand{\coords}[2]{\left\{#1\right\}_{#2}}\) \(\newcommand{\gray}[1]{\color{gray}{#1}}\) \(\newcommand{\lgray}[1]{\color{lightgray}{#1}}\) \(\newcommand{\rank}{\operatorname{rank}}\) \(\newcommand{\row}{\text{Row}}\) \(\newcommand{\col}{\text{Col}}\) \(\renewcommand{\row}{\text{Row}}\) \(\newcommand{\nul}{\text{Nul}}\) \(\newcommand{\var}{\text{Var}}\) \(\newcommand{\corr}{\text{corr}}\) \(\newcommand{\len}[1]{\left|#1\right|}\) \(\newcommand{\bbar}{\overline{\bvec}}\) \(\newcommand{\bhat}{\widehat{\bvec}}\) \(\newcommand{\bperp}{\bvec^\perp}\) \(\newcommand{\xhat}{\widehat{\xvec}}\) \(\newcommand{\vhat}{\widehat{\vvec}}\) \(\newcommand{\uhat}{\widehat{\uvec}}\) \(\newcommand{\what}{\widehat{\wvec}}\) \(\newcommand{\Sighat}{\widehat{\Sigma}}\) \(\newcommand{\lt}{<}\) \(\newcommand{\gt}{>}\) \(\newcommand{\amp}{&}\) \(\definecolor{fillinmathshade}{gray}{0.9}\)Objetivos de aprendizaje
- Definir “estadística descriptiva”
- Distinguir entre estadística descriptiva y estadística inferencial
Las estadísticas descriptivas son números que se utilizan para resumir y describir datos. La palabra “datos” se refiere a la información que se ha recabado de un experimento, una encuesta, un registro histórico, etc. (Por cierto, “datos” es plural. Una pieza de información se llama “datum”.) Si estamos analizando los certificados de nacimiento, por ejemplo, una estadística descriptiva podría ser el porcentaje de certificados emitidos en el Estado de Nueva York, o la edad promedio de la madre. Cualquier otro número que escojamos calcular también cuenta como estadística descriptiva para los datos a partir de los cuales se calcula la estadística. A menudo se utilizan varias estadísticas descriptivas a la vez, para dar una imagen completa de los datos.
Las estadísticas descriptivas son solo descriptivas. No implican generalizar más allá de los datos a la mano. Generalizar de nuestros datos a otro conjunto de casos es el negocio de la estadística inferencial, que estarás estudiando en otra Sección. Aquí nos enfocamos en (meras) estadísticas descriptivas. Algunas estadísticas descriptivas se muestran en la Tabla\(\PageIndex{1}\). En la tabla se muestran los salarios promedio de diversas ocupaciones en Estados Unidos en\(1999\). (Haga clic aquí para ver cuánto ganan las personas con otras ocupaciones).
Sueldo | Ocupación |
---|---|
$112,760 | pediatras |
$106,130 | dentistas |
$100,090 | podólogos |
$76,140 | físicos |
$53,410 | arquitectos |
49,720 | psicólogos escolares, clínicos y de consejería |
$47,910 | auxiliares de vuelo |
$39,560 | profesores de primaria |
$38,710 | oficiales de policía |
$18,980 | diseñadores florales |
Las estadísticas descriptivas como estas ofrecen una visión de la sociedad estadounidense. Es interesante señalar, por ejemplo, que pagamos a las personas que educan a nuestros hijos y que protegen a nuestros ciudadanos mucho menos de lo que pagamos a las personas que cuidan nuestros pies o nuestros dientes.
Para estadísticas más descriptivas, considere Tabla\(\PageIndex{2}\) que muestra el número de hombres solteros por mujer\(100\) soltera en las áreas metropolitanas de Estados Unidos en\(1990\). De esta tabla vemos que los hombres superan en número a las mujeres en Jacksonville, NC, y las mujeres superan en número a los hombres en Sarasota, FL. ¡Puedes ver que las estadísticas descriptivas pueden ser útiles si estamos buscando una pareja del sexo contrario! (Estos datos provienen del Almanaque Informativo Favor.)
Ciudades con mayormente hombres | Hombres por 100 Mujeres | Ciudades con mayormente mujeres | Hombres por 100 Mujeres |
---|---|---|---|
1. Jacksonville (Carolina del Norte) |
224
|
1. Sarasota (Florida) |
66
|
2. Killeen-Temple (Texas) |
123
|
2. Bradenton (Florida) |
68
|
3. Fayetteville (Carolina del Norte) |
118
|
3. Altoona (Pensilvania) |
69
|
4. Brazoria (Texas) |
117
|
4. Springfield (IL) |
70
|
5. Lawton (OK) |
116
|
5. Jacksonville (Tennesse) |
70
|
6. State College (PA) |
113
|
6. Gadsden |
70
|
7. Clarksville-Hopkinsville, TN-KY |
113
|
7. Ruedas, WV |
70
|
8. Anchorage |
112
|
8. Charleston (Virginia Virginia) |
71
|
9. Salinas-Mar-Monterey, CA |
112
|
9. St. Joseph (Misuri) |
71
|
10. Bryan-College Station (Texas) |
111
|
10. Lynchburg (Virginia) |
71
|
NOTA: Soltero incluye personas nunca casadas, viudas y divorciadas,\(15\) años o más.
Estas estadísticas descriptivas pueden hacernos reflexionar por qué los números son tan dispares en estas ciudades. Una posible explicación, por ejemplo, de por qué hay más mujeres en Florida que hombres puede implicar el hecho de que las personas mayores tienden a trasladarse a la región de Sarasota y que las mujeres tienden a sobrevivir a los hombres. Así, podrían vivir en Sarasota más mujeres que hombres. No obstante, a falta de datos adecuados, esto es sólo especulación.
Probablemente sepas que las estadísticas descriptivas son centrales para el mundo del deporte. Cada evento deportivo produce numerosas estadísticas como el porcentaje de tiros de jugadores en un equipo de basquetbol. Para el maratón olímpico (una carrera a pie de\(26.2\) millas), poseemos datos que cubren más de un siglo de competencia. (Los primeros Juegos Olímpicos modernos tuvieron lugar en\(1896\).) En la tabla se\(\PageIndex{3}\) muestran los tiempos ganadores tanto para hombres como para mujeres (a estos últimos sólo se les ha permitido competir desde entonces\(1984\)).
Mujeres | |||
---|---|---|---|
Año | Ganador | País | Tiempo |
1984 | Joan Benoit | USA | 2:24:52 |
1988 | Rosa Mota | POR | 2:25:40 |
1992 | Valentina Yegorova | UT | 2:32:41 |
1996 | Fatuma Roba | ETH | 2:26:05 |
2000 | Naoko Takahashi | JPN | 2:23:14 |
2004 | Mizuki Noguchi | JPN | 2:26:20 |
Hombres | |||
Año | Ganador | País | Tiempo |
1896 | Spiridon Louis | GRE | 2:58:50 |
1900 | Michel Theato | FRA | 2:59:45 |
1904 | Thomas Hicks | USA | 3:28:53 |
1906 | Billy Sherring | PUEDE | 2:51:23 |
1908 | Johnny Hayes | USA | 2:55:18 |
1912 | Kenneth McArthur | S. Afr. | 2:36:54 |
1920 | Hannes Kolehmainen | ALETA | 2:32:35 |
1924 | Albin Stenroos | ALETA | 2:41:22 |
1928 | Boughra El Ouafi | FRA | 2:32:57 |
1932 | Juan Carlos Zabala | ARG | 2:31:36 |
1936 | Sohn Kee-Chung | JPN | 2:29:19 |
1948 | Delfo Cabrera | ARG | 2:34:51 |
1952 | Emil Ztopek | CZE | 2:23:03 |
1956 | Alain Mimoun | FRA | 2:25:00 |
1960 | Abe Bikila | ETH | 2:15:16 |
1964 | Abe Bikila | ETH | 2:12:11 |
1968 | Mamo Wolde | ETH | 2:20:26 |
1972 | Frank Shorter | USA | 2:12:19 |
1976 | Waldemar Cierpinski | E.Ger | 2:09:55 |
1980 | Waldemar Cierpinski | E.Ger | 2:11:03 |
1984 | Carlos Lopes | POR | 2:09:21 |
1988 | Gelindo Bordin | ITA | 2:10:32 |
1992 | Hwang Young-Cho | S. Kor | 2:13:23 |
1996 | Josia Thugwane | S. Afr. | 2:12:36 |
2000 | Gezahenge Abera | ETH | 2:10 .10 |
2004 | Stefano Baldini | ITA | 2:10:55 |
Hay muchas estadísticas descriptivas que podemos calcular a partir de los datos de la tabla. Para conocer la mejora de la velocidad a lo largo de los años, dividamos los tiempos de los hombres en dos piezas, a saber, las primeras\(13\) carreras (hasta\(1952\)) y la segunda\(13\) (a partir de\(1956\)). El tiempo medio de ganar para las primeras\(13\) carreras es\(2\) horas,\(44\) minutos y\(22\) segundos (escrito\(2:44:22\)). El tiempo medio de ganar para las segundas\(13\) carreras es\(2:13:18\). Esta es una gran diferencia (más de media hora). ¿Prueba esto que los hombres más rápidos corren más rápido? ¿O la diferencia se debe solo al azar, no más de lo que a menudo surge de las diferencias de azar en el desempeño de un año a otro? No podemos responder a esta pregunta solo con estadísticas descriptivas. Todo lo que podemos afirmar es que los dos medios son “sugerentes”.
Examinar la Tabla 3 lleva a muchas otras preguntas. Observamos que Takahashi (la corredora principal en\(2000\)) habría vencido al corredor masculino en\(1956\) y a todos los corredores masculinos en las primeras\(12\) maratones. Este hecho nos lleva a preguntarnos si la brecha de género se cerrará o se mantendrá constante. Cuando miramos los tiempos dentro de cada género, también nos preguntamos cuánto disminuirán (si acaso) en el próximo siglo de las Olimpiadas. ¿Podríamos presenciar algún día un maratón de sub-\(2\) hora? El estudio de la estadística puede ayudarte a hacer conjeturas razonables sobre las respuestas a estas preguntas.
- Mikki Hebl