1.6: Tipos de análisis estadísticos
- Page ID
- 150843
Ahora que entendemos la naturaleza de nuestros datos, pasemos a los tipos de estadísticas que podemos usar para interpretarlos. Existen 2 tipos de estadísticas: descriptivas e inferenciales.
Estadística Descriptiva
Las estadísticas descriptivas son números que se utilizan para resumir y describir datos. La palabra “datos” se refiere a la información que se ha recabado de un experimento, una encuesta, un registro histórico, etc. (Por cierto, “datos” es plural. Una pieza de información se llama “datum”.) Si estamos analizando los certificados de nacimiento, por ejemplo, una estadística descriptiva podría ser el porcentaje de certificados emitidos en el Estado de Nueva York, o la edad promedio de la madre. Cualquier otro número que escojamos calcular también cuenta como estadística descriptiva para los datos a partir de los cuales se calcula la estadística. A menudo se utilizan varias estadísticas descriptivas a la vez para dar una imagen completa de los datos. Las estadísticas descriptivas son solo descriptivas. No implican generalizar más allá de los datos a la mano. Generalizar de nuestros datos a otro conjunto de casos es el negocio de la estadística inferencial, que estarás estudiando en otra sección. Aquí nos enfocamos en (meras) estadísticas descriptivas. Algunas estadísticas descriptivas se muestran en la Tabla\(\PageIndex{1}\). El cuadro muestra los salarios promedio de diversas ocupaciones en Estados Unidos en 1999.
Sueldo | Ocupación |
---|---|
$112,760 | pediatras |
$106,130 | dentistas |
$100,090 | podólogos |
$76,140 | físicos |
53,410 | arquitectos |
49,720 | psicólogos escolares, clínicos y de consejería |
$47,910 | auxiliares de vuelo |
$39,560 | profesores de primaria |
38,710 | oficiales de policía |
$18,980 | diseñadores florales |
Las estadísticas descriptivas como estas ofrecen una visión de la sociedad estadounidense. Es interesante señalar, por ejemplo, que pagamos a las personas que educan a nuestros hijos y que protegen a nuestros ciudadanos mucho menos de lo que pagamos a las personas que cuidan nuestros pies o nuestros dientes.
Para estadísticas más descriptivas, considere Tabla\(\PageIndex{2}\). Muestra el número de hombres solteros por cada 100 mujeres solteras en las áreas metropolitanas de Estados Unidos en 1990. De esta tabla vemos que los hombres superan en número a las mujeres en Jacksonville, NC, y las mujeres superan en número a los hombres en Sarasota, FL. ¡Puedes ver que las estadísticas descriptivas pueden ser útiles si estamos buscando una pareja del sexo contrario! (Estos datos provienen del Almanaque Informativo Favor.)
Ciudades con mayormente hombres | Hombres por 100 Mujeres | Ciudades con mayormente mujeres | Hombres por 100 Mujeres |
---|---|---|---|
1. Jacksonville (Carolina del Norte) | 224 | 1. Sarasota (Florida) | 66 |
2. Killeen-Temple (Texas) | 123 | 2. Bradenton (Florida) | 68 |
3. Fayetteville (Carolina del Norte) | 118 | 3. Altoona | 69 |
4. Brazoria (Texas) | 117 | 4. Springfield (Illinois) | 70 |
5. Lawton | 116 | 5. Jacksonville (TN) | 70 |
6. State College (PA) | 113 | 6. Gadsden | 70 |
7. ClarksvilleHopkinsville, TN-KY | 113 | 7. Ruedas, WV | 70 |
8. Anchorage | 112 | 8. Charleston (Virginia Virginia) | 71 |
9. Salinas-SeasiDemonterey, CA | 112 | 9. St. Joseph (Misuri) | 71 |
10. Bryan-College Station (Texas) | 111 | 10. Lynchburg | 71 |
NOTA: Soltero incluye personas nunca casadas, viudas y divorciadas, de 15 años o más.
Estas estadísticas descriptivas pueden hacernos reflexionar por qué los números son tan dispares en estas ciudades. Una posible explicación, por ejemplo, de por qué hay más mujeres en Florida que hombres puede implicar el hecho de que las personas mayores tienden a trasladarse a la región de Sarasota y que las mujeres tienden a sobrevivir a los hombres. Así, podrían vivir en Sarasota más mujeres que hombres. No obstante, a falta de datos adecuados, esto es sólo especulación.
Probablemente sepas que las estadísticas descriptivas son centrales para el mundo del deporte. Cada evento deportivo produce numerosas estadísticas como el porcentaje de tiros de jugadores en un equipo de basquetbol. Para el maratón olímpico (una carrera a pie de 26.2 millas), poseemos datos que cubren más de un siglo de competencia. (Los primeros Juegos Olímpicos modernos tuvieron lugar en 1896.) En la siguiente tabla se muestran los tiempos ganadores tanto para hombres como para mujeres (a estos últimos sólo se les ha permitido competir desde 1984).
Año | Ganador | País | Tiempo |
---|---|---|---|
Mujeres | |||
1984 | Joan Benoit | USA | 2:24:52 |
1988 | Rosa Mota | POR | 2:25:40 |
1992 | Valentina Yegorova | UT | 2:32:41 |
1996 | Fatuma Roba | ETH | 2:26:05 |
2000 | Naoko Takahashi | JPN | 2:23:14 |
2004 | Mizuki Noguchi | JPN | 2:26:20 |
Hombres | |||
1896 | Spiridon Louis | GRE | 2:58:50 |
1900 | Michel Theato | FRA | 2:59:45 |
1904 | Thomas Hicks | USA | 3:28:53 |
1906 | Billy Sherring | PUEDE | 2:51:23 |
1908 | Johnny Hayes | USA | 2:55:18 |
1912 | Kenneth McArthur | S. Afr. | 2:36:54 |
1920 | Hannes Kolehmainen | ALETA | 2:32:35 |
1924 | Albin Stenroos | ALETA | 2:41:22 |
1928 | Boughra El Ouafi | FRA | 2:32:57 |
1932 | Juan Carlos Zabala | ARG | 2:31:36 |
1936 | Sohn Kee-Chung | JPN | 2:29:19 |
1948 | Delfo Cabrera | ARG | 2:34:51 |
1952 | Emil Ztopek | CZE | 2:23:03 |
1956 | Alain Mimoun | FRA | 2:25:00 |
1960 | Abe Bikila | ETH | 2:15:16 |
1964 | Abe Bikila | ETH | 2:12:11 |
1968 | Mamo Wolde | ETH | 2:20:26 |
1972 | Frank Shorter | USA | 2:12:19 |
1976 | Waldemar Cierpinski | E.Ger | 2:09:55 |
1980 | Waldemar Cierpinski | E.Ger | 2:11:03 |
1984 | Carlos Lopes | POR | 2:09:21 |
1988 | Gelindo Bordin | ITA | 2:10:32 |
1992 | Hwang Young-Cho | S. Kor | 2:13:23 |
1996 | Josia Thugwane | S. Afr. | 2:12:36 |
2000 | Gezahenge Abera | ETH | 2:10 .10 |
2004 | Stefano Baldini | ITA | 2:10:55 |
Hay muchas estadísticas descriptivas que podemos calcular a partir de los datos de la tabla. Para conocer la mejora de la velocidad a lo largo de los años, dividamos los tiempos masculinos en dos piezas, a saber, las primeras 13 carreras (hasta 1952) y la segunda 13 (a partir de 1956). El tiempo medio de ganar para las primeras 13 carreras es de 2 horas, 44 minutos y 22 segundos (escrito 2:44:22). El tiempo medio de ganar para las segundas 13 carreras es 2:13:18. Esta es una gran diferencia (más de media hora). ¿Prueba esto que los hombres más rápidos corren más rápido? ¿O la diferencia se debe solo al azar, no más de lo que a menudo surge de las diferencias de azar en el desempeño de un año a otro? No podemos responder a esta pregunta solo con estadísticas descriptivas. Todo lo que podemos afirmar es que los dos medios son “sugerentes”.
Mesa de examen\(\PageIndex{3}\) lleva a muchas otras preguntas. Observamos que Takahashi (la corredora principal femenina en 2000) habría vencido al corredor masculino en 1956 y a todos los corredores masculinos en las primeras 12 maratones. Este hecho nos lleva a preguntarnos si la brecha de género se cerrará o se mantendrá constante. Cuando miramos los tiempos dentro de cada género, también nos preguntamos hasta qué punto disminuirán (si acaso) en el próximo siglo de las Olimpiadas. ¿Podríamos presenciar algún día un maratón sub-2 horas? El estudio de la estadística puede ayudarte a hacer conjeturas razonables sobre las respuestas a estas preguntas.
También es importante diferenciar lo que usamos para describir poblaciones vs lo que usamos para describir muestras. Una población es descrita por un parámetro; el parámetro es el verdadero valor de lo descriptivo en la población, pero uno que nunca podremos saber con certeza. Por ejemplo, la Oficina de Estadísticas Laborales informa que el salario promedio por hora de los chefs es de 23.87 dólares. Sin embargo, aunque este número se computara utilizando información de cada chef en Estados Unidos (convirtiéndolo en un parámetro), rápidamente se volvería ligeramente apagado a medida que un chef se jubiera y un nuevo chef ingresara al mercado laboral. Adicionalmente, como se señaló anteriormente, prácticamente no hay forma de recolectar datos de cada persona en una población. Para entender una variable, estimamos el parámetro poblacional utilizando un estadístico muestral. Aquí, el término “estadística” se refiere al número específico que calculamos a partir de los datos (por ejemplo, el promedio), no el campo de la estadística. Un estadístico muestral es una estimación del parámetro poblacional verdadero, y si nuestra muestra es representativa de la población, entonces el estadístico se considera un buen estimador del parámetro.
Incluso la mejor muestra estará algo alejada de la población completa, antes referida como sesgo muestral, y como resultado, siempre habrá una pequeña discrepancia entre el parámetro y el estadístico que usamos para estimarlo. Esta diferencia se conoce como error de muestreo y, como veremos a lo largo del curso, entender el error de muestreo es la clave para comprender las estadísticas. Toda observación que hagamos sobre una variable, ya sea un estudio completo de investigación o la observación del comportamiento de un individuo, es incapaz de ser completamente representativa de todas las posibilidades para esa variable. Saber dónde trazar la línea entre una observación inusual y una verdadera diferencia es de lo que se trata la estadística.
Estadísticas Inferenciales
Las estadísticas descriptivas son maravillosas para decirnos cómo son nuestros datos. Sin embargo, lo que a menudo queremos entender es cómo se comportan nuestros datos. ¿Qué variables están relacionadas con otras variables? ¿Bajo qué condiciones cambiará el valor de una variable? ¿Son dos grupos diferentes entre sí, y si es así, las personas dentro de cada grupo son diferentes o similares? Estas son las preguntas respondidas por las estadísticas inferenciales, y las estadísticas inferenciales son cómo generalizamos desde nuestra muestra hasta nuestra población. Las unidades 2 y 3 tienen que ver con las estadísticas inferenciales, los análisis formales y las pruebas que realizamos para sacar conclusiones sobre nuestros datos.
Por ejemplo, aprenderemos a usar una estadística t para determinar si las personas cambian con el tiempo cuando se inscriben en una intervención. También utilizaremos un estadístico F para determinar si podemos predecir valores futuros en una variable en base a los valores actuales conocidos de una variable. Existen muchos tipos de estadísticas inferenciales, cada una de las cuales nos permite conocer un comportamiento diferente de los datos que recopilamos. Este curso solo tocará un pequeño subconjunto (o una muestra) de ellos, pero los principios que aprendamos en el camino facilitarán el aprendizaje de nuevas pruebas, ya que la mayoría de las estadísticas inferenciales siguen la misma estructura y formato.