Saltar al contenido principal
LibreTexts Español

1.6: Tipos de análisis estadísticos

  • Page ID
    150843
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Ahora que entendemos la naturaleza de nuestros datos, pasemos a los tipos de estadísticas que podemos usar para interpretarlos. Existen 2 tipos de estadísticas: descriptivas e inferenciales.

    Estadística Descriptiva

    Las estadísticas descriptivas son números que se utilizan para resumir y describir datos. La palabra “datos” se refiere a la información que se ha recabado de un experimento, una encuesta, un registro histórico, etc. (Por cierto, “datos” es plural. Una pieza de información se llama “datum”.) Si estamos analizando los certificados de nacimiento, por ejemplo, una estadística descriptiva podría ser el porcentaje de certificados emitidos en el Estado de Nueva York, o la edad promedio de la madre. Cualquier otro número que escojamos calcular también cuenta como estadística descriptiva para los datos a partir de los cuales se calcula la estadística. A menudo se utilizan varias estadísticas descriptivas a la vez para dar una imagen completa de los datos. Las estadísticas descriptivas son solo descriptivas. No implican generalizar más allá de los datos a la mano. Generalizar de nuestros datos a otro conjunto de casos es el negocio de la estadística inferencial, que estarás estudiando en otra sección. Aquí nos enfocamos en (meras) estadísticas descriptivas. Algunas estadísticas descriptivas se muestran en la Tabla\(\PageIndex{1}\). El cuadro muestra los salarios promedio de diversas ocupaciones en Estados Unidos en 1999.

    Cuadro\(\PageIndex{1}\): Salarios promedio de diversas ocupaciones en 1999.
    Sueldo Ocupación
    $112,760 pediatras
    $106,130 dentistas
    $100,090 podólogos
    $76,140 físicos
    53,410 arquitectos
    49,720 psicólogos escolares, clínicos y de consejería
    $47,910 auxiliares de vuelo
    $39,560 profesores de primaria
    38,710 oficiales de policía
    $18,980 diseñadores florales

    Las estadísticas descriptivas como estas ofrecen una visión de la sociedad estadounidense. Es interesante señalar, por ejemplo, que pagamos a las personas que educan a nuestros hijos y que protegen a nuestros ciudadanos mucho menos de lo que pagamos a las personas que cuidan nuestros pies o nuestros dientes.

    Para estadísticas más descriptivas, considere Tabla\(\PageIndex{2}\). Muestra el número de hombres solteros por cada 100 mujeres solteras en las áreas metropolitanas de Estados Unidos en 1990. De esta tabla vemos que los hombres superan en número a las mujeres en Jacksonville, NC, y las mujeres superan en número a los hombres en Sarasota, FL. ¡Puedes ver que las estadísticas descriptivas pueden ser útiles si estamos buscando una pareja del sexo contrario! (Estos datos provienen del Almanaque Informativo Favor.)

    Cuadro\(\PageIndex{2}\): Número de hombres solteros por cada 100 mujeres solteras en las áreas metropolitanas de Estados Unidos en 1990.
    Ciudades con mayormente hombres Hombres por 100 Mujeres Ciudades con mayormente mujeres Hombres por 100 Mujeres
    1. Jacksonville (Carolina del Norte) 224 1. Sarasota (Florida) 66
    2. Killeen-Temple (Texas) 123 2. Bradenton (Florida) 68
    3. Fayetteville (Carolina del Norte) 118 3. Altoona 69
    4. Brazoria (Texas) 117 4. Springfield (Illinois) 70
    5. Lawton 116 5. Jacksonville (TN) 70
    6. State College (PA) 113 6. Gadsden 70
    7. ClarksvilleHopkinsville, TN-KY 113 7. Ruedas, WV 70
    8. Anchorage 112 8. Charleston (Virginia Virginia) 71
    9. Salinas-SeasiDemonterey, CA 112 9. St. Joseph (Misuri) 71
    10. Bryan-College Station (Texas) 111 10. Lynchburg 71

    NOTA: Soltero incluye personas nunca casadas, viudas y divorciadas, de 15 años o más.

    Estas estadísticas descriptivas pueden hacernos reflexionar por qué los números son tan dispares en estas ciudades. Una posible explicación, por ejemplo, de por qué hay más mujeres en Florida que hombres puede implicar el hecho de que las personas mayores tienden a trasladarse a la región de Sarasota y que las mujeres tienden a sobrevivir a los hombres. Así, podrían vivir en Sarasota más mujeres que hombres. No obstante, a falta de datos adecuados, esto es sólo especulación.

    Probablemente sepas que las estadísticas descriptivas son centrales para el mundo del deporte. Cada evento deportivo produce numerosas estadísticas como el porcentaje de tiros de jugadores en un equipo de basquetbol. Para el maratón olímpico (una carrera a pie de 26.2 millas), poseemos datos que cubren más de un siglo de competencia. (Los primeros Juegos Olímpicos modernos tuvieron lugar en 1896.) En la siguiente tabla se muestran los tiempos ganadores tanto para hombres como para mujeres (a estos últimos sólo se les ha permitido competir desde 1984).

    Tabla\(\PageIndex{3}\): Tiempos ganadores del maratón olímpico.
    Año Ganador País Tiempo
    Mujeres
    1984 Joan Benoit USA 2:24:52
    1988 Rosa Mota POR 2:25:40
    1992 Valentina Yegorova UT 2:32:41
    1996 Fatuma Roba ETH 2:26:05
    2000 Naoko Takahashi JPN 2:23:14
    2004 Mizuki Noguchi JPN 2:26:20
    Hombres
    1896 Spiridon Louis GRE 2:58:50
    1900 Michel Theato FRA 2:59:45
    1904 Thomas Hicks USA 3:28:53
    1906 Billy Sherring PUEDE 2:51:23
    1908 Johnny Hayes USA 2:55:18
    1912 Kenneth McArthur S. Afr. 2:36:54
    1920 Hannes Kolehmainen ALETA 2:32:35
    1924 Albin Stenroos ALETA 2:41:22
    1928 Boughra El Ouafi FRA 2:32:57
    1932 Juan Carlos Zabala ARG 2:31:36
    1936 Sohn Kee-Chung JPN 2:29:19
    1948 Delfo Cabrera ARG 2:34:51
    1952 Emil Ztopek CZE 2:23:03
    1956 Alain Mimoun FRA 2:25:00
    1960 Abe Bikila ETH 2:15:16
    1964 Abe Bikila ETH 2:12:11
    1968 Mamo Wolde ETH 2:20:26
    1972 Frank Shorter USA 2:12:19
    1976 Waldemar Cierpinski E.Ger 2:09:55
    1980 Waldemar Cierpinski E.Ger 2:11:03
    1984 Carlos Lopes POR 2:09:21
    1988 Gelindo Bordin ITA 2:10:32
    1992 Hwang Young-Cho S. Kor 2:13:23
    1996 Josia Thugwane S. Afr. 2:12:36
    2000 Gezahenge Abera ETH 2:10 .10
    2004 Stefano Baldini ITA 2:10:55

    Hay muchas estadísticas descriptivas que podemos calcular a partir de los datos de la tabla. Para conocer la mejora de la velocidad a lo largo de los años, dividamos los tiempos masculinos en dos piezas, a saber, las primeras 13 carreras (hasta 1952) y la segunda 13 (a partir de 1956). El tiempo medio de ganar para las primeras 13 carreras es de 2 horas, 44 minutos y 22 segundos (escrito 2:44:22). El tiempo medio de ganar para las segundas 13 carreras es 2:13:18. Esta es una gran diferencia (más de media hora). ¿Prueba esto que los hombres más rápidos corren más rápido? ¿O la diferencia se debe solo al azar, no más de lo que a menudo surge de las diferencias de azar en el desempeño de un año a otro? No podemos responder a esta pregunta solo con estadísticas descriptivas. Todo lo que podemos afirmar es que los dos medios son “sugerentes”.

    Mesa de examen\(\PageIndex{3}\) lleva a muchas otras preguntas. Observamos que Takahashi (la corredora principal femenina en 2000) habría vencido al corredor masculino en 1956 y a todos los corredores masculinos en las primeras 12 maratones. Este hecho nos lleva a preguntarnos si la brecha de género se cerrará o se mantendrá constante. Cuando miramos los tiempos dentro de cada género, también nos preguntamos hasta qué punto disminuirán (si acaso) en el próximo siglo de las Olimpiadas. ¿Podríamos presenciar algún día un maratón sub-2 horas? El estudio de la estadística puede ayudarte a hacer conjeturas razonables sobre las respuestas a estas preguntas.

    También es importante diferenciar lo que usamos para describir poblaciones vs lo que usamos para describir muestras. Una población es descrita por un parámetro; el parámetro es el verdadero valor de lo descriptivo en la población, pero uno que nunca podremos saber con certeza. Por ejemplo, la Oficina de Estadísticas Laborales informa que el salario promedio por hora de los chefs es de 23.87 dólares. Sin embargo, aunque este número se computara utilizando información de cada chef en Estados Unidos (convirtiéndolo en un parámetro), rápidamente se volvería ligeramente apagado a medida que un chef se jubiera y un nuevo chef ingresara al mercado laboral. Adicionalmente, como se señaló anteriormente, prácticamente no hay forma de recolectar datos de cada persona en una población. Para entender una variable, estimamos el parámetro poblacional utilizando un estadístico muestral. Aquí, el término “estadística” se refiere al número específico que calculamos a partir de los datos (por ejemplo, el promedio), no el campo de la estadística. Un estadístico muestral es una estimación del parámetro poblacional verdadero, y si nuestra muestra es representativa de la población, entonces el estadístico se considera un buen estimador del parámetro.

    Incluso la mejor muestra estará algo alejada de la población completa, antes referida como sesgo muestral, y como resultado, siempre habrá una pequeña discrepancia entre el parámetro y el estadístico que usamos para estimarlo. Esta diferencia se conoce como error de muestreo y, como veremos a lo largo del curso, entender el error de muestreo es la clave para comprender las estadísticas. Toda observación que hagamos sobre una variable, ya sea un estudio completo de investigación o la observación del comportamiento de un individuo, es incapaz de ser completamente representativa de todas las posibilidades para esa variable. Saber dónde trazar la línea entre una observación inusual y una verdadera diferencia es de lo que se trata la estadística.

    Estadísticas Inferenciales

    Las estadísticas descriptivas son maravillosas para decirnos cómo son nuestros datos. Sin embargo, lo que a menudo queremos entender es cómo se comportan nuestros datos. ¿Qué variables están relacionadas con otras variables? ¿Bajo qué condiciones cambiará el valor de una variable? ¿Son dos grupos diferentes entre sí, y si es así, las personas dentro de cada grupo son diferentes o similares? Estas son las preguntas respondidas por las estadísticas inferenciales, y las estadísticas inferenciales son cómo generalizamos desde nuestra muestra hasta nuestra población. Las unidades 2 y 3 tienen que ver con las estadísticas inferenciales, los análisis formales y las pruebas que realizamos para sacar conclusiones sobre nuestros datos.

    Por ejemplo, aprenderemos a usar una estadística t para determinar si las personas cambian con el tiempo cuando se inscriben en una intervención. También utilizaremos un estadístico F para determinar si podemos predecir valores futuros en una variable en base a los valores actuales conocidos de una variable. Existen muchos tipos de estadísticas inferenciales, cada una de las cuales nos permite conocer un comportamiento diferente de los datos que recopilamos. Este curso solo tocará un pequeño subconjunto (o una muestra) de ellos, pero los principios que aprendamos en el camino facilitarán el aprendizaje de nuevas pruebas, ya que la mayoría de las estadísticas inferenciales siguen la misma estructura y formato.


    This page titled 1.6: Tipos de análisis estadísticos is shared under a CC BY-NC-SA 4.0 license and was authored, remixed, and/or curated by Foster et al. (University of Missouri’s Affordable and Open Access Educational Resources Initiative) via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.