1.6: Tipos de análisis estadísticos

Última actualización
Guardar como PDF

Page ID: 150843

Foster et al.
University of Missouri-St. Louis, Rice University, & University of Houston, Downtown Campus via University of Missouri’s Affordable and Open Access Educational Resources Initiative

$ \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } $ $ \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} $$\newcommand{\id}{\mathrm{id}}$ $ \newcommand{\Span}{\mathrm{span}}$ $ \newcommand{\kernel}{\mathrm{null}\,}$ $ \newcommand{\range}{\mathrm{range}\,}$ $ \newcommand{\RealPart}{\mathrm{Re}}$ $ \newcommand{\ImaginaryPart}{\mathrm{Im}}$ $ \newcommand{\Argument}{\mathrm{Arg}}$ $ \newcommand{\norm}[1]{\| #1 \|}$ $ \newcommand{\inner}[2]{\langle #1, #2 \rangle}$ $ \newcommand{\Span}{\mathrm{span}}$ $\newcommand{\id}{\mathrm{id}}$ $ \newcommand{\Span}{\mathrm{span}}$ $ \newcommand{\kernel}{\mathrm{null}\,}$ $ \newcommand{\range}{\mathrm{range}\,}$ $ \newcommand{\RealPart}{\mathrm{Re}}$ $ \newcommand{\ImaginaryPart}{\mathrm{Im}}$ $ \newcommand{\Argument}{\mathrm{Arg}}$ $ \newcommand{\norm}[1]{\| #1 \|}$ $ \newcommand{\inner}[2]{\langle #1, #2 \rangle}$ $ \newcommand{\Span}{\mathrm{span}}$$\newcommand{\AA}{\unicode[.8,0]{x212B}}$

Ahora que entendemos la naturaleza de nuestros datos, pasemos a los tipos de estadísticas que podemos usar para interpretarlos. Existen 2 tipos de estadísticas: descriptivas e inferenciales.

Estadística Descriptiva

Las estadísticas descriptivas son números que se utilizan para resumir y describir datos. La palabra “datos” se refiere a la información que se ha recabado de un experimento, una encuesta, un registro histórico, etc. (Por cierto, “datos” es plural. Una pieza de información se llama “datum”.) Si estamos analizando los certificados de nacimiento, por ejemplo, una estadística descriptiva podría ser el porcentaje de certificados emitidos en el Estado de Nueva York, o la edad promedio de la madre. Cualquier otro número que escojamos calcular también cuenta como estadística descriptiva para los datos a partir de los cuales se calcula la estadística. A menudo se utilizan varias estadísticas descriptivas a la vez para dar una imagen completa de los datos. Las estadísticas descriptivas son solo descriptivas. No implican generalizar más allá de los datos a la mano. Generalizar de nuestros datos a otro conjunto de casos es el negocio de la estadística inferencial, que estarás estudiando en otra sección. Aquí nos enfocamos en (meras) estadísticas descriptivas. Algunas estadísticas descriptivas se muestran en la Tabla$\PageIndex{1}$. El cuadro muestra los salarios promedio de diversas ocupaciones en Estados Unidos en 1999.

Cuadro$\PageIndex{1}$: Salarios promedio de diversas ocupaciones en 1999.
Sueldo	Ocupación
$112,760	pediatras
$106,130	dentistas
$100,090	podólogos
$76,140	físicos
53,410	arquitectos
49,720	psicólogos escolares, clínicos y de consejería
$47,910	auxiliares de vuelo
$39,560	profesores de primaria
38,710	oficiales de policía
$18,980	diseñadores florales

Las estadísticas descriptivas como estas ofrecen una visión de la sociedad estadounidense. Es interesante señalar, por ejemplo, que pagamos a las personas que educan a nuestros hijos y que protegen a nuestros ciudadanos mucho menos de lo que pagamos a las personas que cuidan nuestros pies o nuestros dientes.

Para estadísticas más descriptivas, considere Tabla$\PageIndex{2}$. Muestra el número de hombres solteros por cada 100 mujeres solteras en las áreas metropolitanas de Estados Unidos en 1990. De esta tabla vemos que los hombres superan en número a las mujeres en Jacksonville, NC, y las mujeres superan en número a los hombres en Sarasota, FL. ¡Puedes ver que las estadísticas descriptivas pueden ser útiles si estamos buscando una pareja del sexo contrario! (Estos datos provienen del Almanaque Informativo Favor.)

Cuadro$\PageIndex{2}$: Número de hombres solteros por cada 100 mujeres solteras en las áreas metropolitanas de Estados Unidos en 1990.
Ciudades con mayormente hombres	Hombres por 100 Mujeres	Ciudades con mayormente mujeres	Hombres por 100 Mujeres
1. Jacksonville (Carolina del Norte)	224	1. Sarasota (Florida)	66
2. Killeen-Temple (Texas)	123	2. Bradenton (Florida)	68
3. Fayetteville (Carolina del Norte)	118	3. Altoona	69
4. Brazoria (Texas)	117	4. Springfield (Illinois)	70
5. Lawton	116	5. Jacksonville (TN)	70
6. State College (PA)	113	6. Gadsden	70
7. ClarksvilleHopkinsville, TN-KY	113	7. Ruedas, WV	70
8. Anchorage	112	8. Charleston (Virginia Virginia)	71
9. Salinas-SeasiDemonterey, CA	112	9. St. Joseph (Misuri)	71
10. Bryan-College Station (Texas)	111	10. Lynchburg	71

NOTA: Soltero incluye personas nunca casadas, viudas y divorciadas, de 15 años o más.

Estas estadísticas descriptivas pueden hacernos reflexionar por qué los números son tan dispares en estas ciudades. Una posible explicación, por ejemplo, de por qué hay más mujeres en Florida que hombres puede implicar el hecho de que las personas mayores tienden a trasladarse a la región de Sarasota y que las mujeres tienden a sobrevivir a los hombres. Así, podrían vivir en Sarasota más mujeres que hombres. No obstante, a falta de datos adecuados, esto es sólo especulación.

Probablemente sepas que las estadísticas descriptivas son centrales para el mundo del deporte. Cada evento deportivo produce numerosas estadísticas como el porcentaje de tiros de jugadores en un equipo de basquetbol. Para el maratón olímpico (una carrera a pie de 26.2 millas), poseemos datos que cubren más de un siglo de competencia. (Los primeros Juegos Olímpicos modernos tuvieron lugar en 1896.) En la siguiente tabla se muestran los tiempos ganadores tanto para hombres como para mujeres (a estos últimos sólo se les ha permitido competir desde 1984).

Tabla$\PageIndex{3}$: Tiempos ganadores del maratón olímpico.
Año	Ganador	País	Tiempo
Mujeres
1984	Joan Benoit	USA	2:24:52
1988	Rosa Mota	POR	2:25:40
1992	Valentina Yegorova	UT	2:32:41
1996	Fatuma Roba	ETH	2:26:05
2000	Naoko Takahashi	JPN	2:23:14
2004	Mizuki Noguchi	JPN	2:26:20
Hombres
1896	Spiridon Louis	GRE	2:58:50
1900	Michel Theato	FRA	2:59:45
1904	Thomas Hicks	USA	3:28:53
1906	Billy Sherring	PUEDE	2:51:23
1908	Johnny Hayes	USA	2:55:18
1912	Kenneth McArthur	S. Afr.	2:36:54
1920	Hannes Kolehmainen	ALETA	2:32:35
1924	Albin Stenroos	ALETA	2:41:22
1928	Boughra El Ouafi	FRA	2:32:57
1932	Juan Carlos Zabala	ARG	2:31:36
1936	Sohn Kee-Chung	JPN	2:29:19
1948	Delfo Cabrera	ARG	2:34:51
1952	Emil Ztopek	CZE	2:23:03
1956	Alain Mimoun	FRA	2:25:00
1960	Abe Bikila	ETH	2:15:16
1964	Abe Bikila	ETH	2:12:11
1968	Mamo Wolde	ETH	2:20:26
1972	Frank Shorter	USA	2:12:19
1976	Waldemar Cierpinski	E.Ger	2:09:55
1980	Waldemar Cierpinski	E.Ger	2:11:03
1984	Carlos Lopes	POR	2:09:21
1988	Gelindo Bordin	ITA	2:10:32
1992	Hwang Young-Cho	S. Kor	2:13:23
1996	Josia Thugwane	S. Afr.	2:12:36
2000	Gezahenge Abera	ETH	2:10 .10
2004	Stefano Baldini	ITA	2:10:55

Hay muchas estadísticas descriptivas que podemos calcular a partir de los datos de la tabla. Para conocer la mejora de la velocidad a lo largo de los años, dividamos los tiempos masculinos en dos piezas, a saber, las primeras 13 carreras (hasta 1952) y la segunda 13 (a partir de 1956). El tiempo medio de ganar para las primeras 13 carreras es de 2 horas, 44 minutos y 22 segundos (escrito 2:44:22). El tiempo medio de ganar para las segundas 13 carreras es 2:13:18. Esta es una gran diferencia (más de media hora). ¿Prueba esto que los hombres más rápidos corren más rápido? ¿O la diferencia se debe solo al azar, no más de lo que a menudo surge de las diferencias de azar en el desempeño de un año a otro? No podemos responder a esta pregunta solo con estadísticas descriptivas. Todo lo que podemos afirmar es que los dos medios son “sugerentes”.

Mesa de examen$\PageIndex{3}$ lleva a muchas otras preguntas. Observamos que Takahashi (la corredora principal femenina en 2000) habría vencido al corredor masculino en 1956 y a todos los corredores masculinos en las primeras 12 maratones. Este hecho nos lleva a preguntarnos si la brecha de género se cerrará o se mantendrá constante. Cuando miramos los tiempos dentro de cada género, también nos preguntamos hasta qué punto disminuirán (si acaso) en el próximo siglo de las Olimpiadas. ¿Podríamos presenciar algún día un maratón sub-2 horas? El estudio de la estadística puede ayudarte a hacer conjeturas razonables sobre las respuestas a estas preguntas.

También es importante diferenciar lo que usamos para describir poblaciones vs lo que usamos para describir muestras. Una población es descrita por un parámetro; el parámetro es el verdadero valor de lo descriptivo en la población, pero uno que nunca podremos saber con certeza. Por ejemplo, la Oficina de Estadísticas Laborales informa que el salario promedio por hora de los chefs es de 23.87 dólares. Sin embargo, aunque este número se computara utilizando información de cada chef en Estados Unidos (convirtiéndolo en un parámetro), rápidamente se volvería ligeramente apagado a medida que un chef se jubiera y un nuevo chef ingresara al mercado laboral. Adicionalmente, como se señaló anteriormente, prácticamente no hay forma de recolectar datos de cada persona en una población. Para entender una variable, estimamos el parámetro poblacional utilizando un estadístico muestral. Aquí, el término “estadística” se refiere al número específico que calculamos a partir de los datos (por ejemplo, el promedio), no el campo de la estadística. Un estadístico muestral es una estimación del parámetro poblacional verdadero, y si nuestra muestra es representativa de la población, entonces el estadístico se considera un buen estimador del parámetro.

Incluso la mejor muestra estará algo alejada de la población completa, antes referida como sesgo muestral, y como resultado, siempre habrá una pequeña discrepancia entre el parámetro y el estadístico que usamos para estimarlo. Esta diferencia se conoce como error de muestreo y, como veremos a lo largo del curso, entender el error de muestreo es la clave para comprender las estadísticas. Toda observación que hagamos sobre una variable, ya sea un estudio completo de investigación o la observación del comportamiento de un individuo, es incapaz de ser completamente representativa de todas las posibilidades para esa variable. Saber dónde trazar la línea entre una observación inusual y una verdadera diferencia es de lo que se trata la estadística.

Estadísticas Inferenciales

Las estadísticas descriptivas son maravillosas para decirnos cómo son nuestros datos. Sin embargo, lo que a menudo queremos entender es cómo se comportan nuestros datos. ¿Qué variables están relacionadas con otras variables? ¿Bajo qué condiciones cambiará el valor de una variable? ¿Son dos grupos diferentes entre sí, y si es así, las personas dentro de cada grupo son diferentes o similares? Estas son las preguntas respondidas por las estadísticas inferenciales, y las estadísticas inferenciales son cómo generalizamos desde nuestra muestra hasta nuestra población. Las unidades 2 y 3 tienen que ver con las estadísticas inferenciales, los análisis formales y las pruebas que realizamos para sacar conclusiones sobre nuestros datos.

Por ejemplo, aprenderemos a usar una estadística t para determinar si las personas cambian con el tiempo cuando se inscriben en una intervención. También utilizaremos un estadístico F para determinar si podemos predecir valores futuros en una variable en base a los valores actuales conocidos de una variable. Existen muchos tipos de estadísticas inferenciales, cada una de las cuales nos permite conocer un comportamiento diferente de los datos que recopilamos. Este curso solo tocará un pequeño subconjunto (o una muestra) de ellos, pero los principios que aprendamos en el camino facilitarán el aprendizaje de nuevas pruebas, ya que la mayoría de las estadísticas inferenciales siguen la misma estructura y formato.