Saltar al contenido principal
LibreTexts Español

15.1: Estadística Descriptiva

  • Page ID
    93866
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    \( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)

    ( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\id}{\mathrm{id}}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\kernel}{\mathrm{null}\,}\)

    \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\)

    \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\)

    \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    \( \newcommand{\vectorA}[1]{\vec{#1}}      % arrow\)

    \( \newcommand{\vectorAt}[1]{\vec{\text{#1}}}      % arrow\)

    \( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vectorC}[1]{\textbf{#1}} \)

    \( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)

    \( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)

    \( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)

    \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    En la ciudad de Nueva York cada verano, algunos gatos caen de ventanas abiertas en edificios de departamentos de gran altura. El 22 de agosto de 1989, The New York Times informó del sorprendente hecho de que los gatos que cayeron más parecían tener más posibilidades de supervivencia. Al verificar con el Centro Médico Animal, el periódico encontró que 129 gatos que habían caído fueron traídos para su tratamiento. Diecisiete de estos fueron puestos a dormir por sus dueños (en la mayoría de los casos porque no podían pagar el tratamiento, más que porque era probable que el gato muriera). Ocho de los 115 gatos restantes murieron. Pero lo sorprendente es que los gatos que cayeron más lejos parecían tener la mayor probabilidad de vivir. Sólo uno de los 22 gatos que cayeron de arriba de 7 pisos murió, y no hubo sino una sola fractura entre los 13 que cayeron más de 9 pisos. ¿Qué podría dar cuenta de esto?

    Comenzaremos con varios conceptos básicos a partir de estadísticas descriptivas que son importantes para el razonamiento. No nos preocuparemos por las fórmulas para calcularlos, pero te encontrarás con estos conceptos fuera de esta clase, así que necesitas aprender lo que significan.

    Una población es un grupo de cosas (e.g., votantes de Florida, hogares, parejas casadas, moscas de la fruta). Y una muestra es un subgrupo de la población. Por ejemplo, podríamos realizar una encuesta a 1,000 graduados universitarios y pedirles que reporten sus ingresos. Estas mil personas constituirían nuestra muestra; la población matriz sería toda egresada universitaria. En la siguiente sección, veremos que la información sobre muestras puede ser utilizada para hacer inferencias sobre poblaciones enteras, pero en esta sección, nos ocuparemos de la descripción más que de la inferencia.

    Un parámetro es alguna característica numérica de toda una población (por ejemplo, promedio promedio de todos los estudiantes de primer año, ingreso promedio de todos los egresados universitarios; como veremos en un momento, también podría ser una medida de dispersión o una medida de correlación. Por ejemplo, un ingreso promedio en la población de ciudadanos estadounidenses adultos de $18,525 es un parámetro.

    Por el contrario, una estadística es una característica numérica correspondiente de una muestra (por ejemplo, el promedio de promedio de estudiantes universitarios contactados en una encuesta reciente). Una manera de recordar lo que va con lo que es que las dos palabras—población y parámetro— van juntas, y las dos palabras s —muestra y estadística— van juntas.

    Características de las muestras

    Las propiedades o características que vienen en grados se denominan variables. Por ejemplo, la edad, el peso y los ingresos de las personas en Estados Unidos son variables. Cada uno de ellos puede tomar muchos valores diferentes: Wilbur pesa 165 libras, Martha 103 y Sam 321. También podemos pensar en cosas más abstractas como variables; por ejemplo, la probabilidad es una variable que puede tomar cualquiera de los infinitamente muchos valores de 0 a 1. En el caso más simple, una variable podría tener solo dos valores; por ejemplo, si estás tomando una clase pasa/falla (tales variables son importantes; se llaman variables dicotómicas).

    Cuando los miembros de una población o muestra se miden con respecto a alguna variable como su puntaje en la prueba ACT, el conjunto resultante de todas las puntuaciones numéricas es una distribución de valores para esa variable. Así, el conjunto de todos los puntajes ACT de un año determinado es una distribución de valores para la variable de los puntajes ACT de ese año. De igual manera, el conjunto de todas las puntuaciones del primer examen en esta clase es una distribución de la variable de puntuaciones en el primer examen.

    Puede ser difícil ver a qué equivale realmente una gran distribución de valores; nos perdemos en un mar de números. Entonces, a menudo es útil condensar la información en la distribución en números más simples. La forma más básica de hacerlo es calcular medidas de tendencia central. Hay tres medidas comunes de este tipo.

    Medidas de Tendencia Central

    El medio es lo que ya conoces bajo el nombre promedio. Para encontrar la media de una distribución, se suman todos los números de la distribución juntos y se dividen por el número de elementos en la distribución. Cuando la clase recibe un examen de vuelta, lo primero que mucha gente quiere saber es la puntuación promedio (es decir, media) en la prueba; esto les dice qué tan bien le fue a la clase colectivamente. La media es la medida más importante de tendencia central, pero tiene la debilidad de que se ve afectada por sólo unos pocos valores extremos.

    La mediana de una distribución es el número tal que la mitad de los números en la distribución son menores que éste y la mitad son mayores. La mediana de los números 1, 2, 3, 4, 5 es 3, porque dos números son menores que ésta y dos son mayores. ¿Y si ningún número único divide una distribución en dos partes iguales, como ocurre en la distribución 1, 2, 3, 4? Aquí tomaremos el número a mitad de camino entre 2 y 3, es decir, 2.5 como la mediana; claramente la mitad de los casos caen por debajo de él y la mitad cae por encima.

    El modo de una distribución es el valor que ocurre con mayor frecuencia en ella. El modo de 1, 2, 3, 2, 4 es 2, porque 2 ocurre dos veces y todos en los otros números ocurren solo una vez. Una distribución puede tener más de un modo. Por ejemplo, la distribución 1, 2, 3, 2, 4, 4, 2, 4 tiene dos modos: 2 y 4.

    ¿Cuáles son la media, mediana y modo del siguiente conjunto de números: 179, 193, 99, 311, 194, 194, 179?

    1. Media: Suma los siete números juntos, lo que rinde 1349. Entonces divide esto por 7, que (redondeo) llega a 192.7.
    2. Mediana: La mediana es más fácil de ver si enumeramos estos números en orden de magnitud, como 99, 179, 179, 193, 194, 194, 311. Aquí encontramos que 193 divide la distribución en dos partes iguales, por lo que es la mediana.
    3. Modo: Esta distribución tiene dos números que ocurren dos veces, 179 y 194. Entonces, tiene dos modos, 179 y 194.

    Medidas de Dispersión

    Las medidas de tendencia central suelen ser útiles. Por ejemplo, te ayudará a entender cómo te fue en un examen para conocer el promedio de clase (la media). Y será más fácil elegir una especialidad si conoces el promedio de personas con esa especialidad que encontraron trabajo poco después de graduarse. Pero las medidas de tendencia central no nos dicen mucho sobre la posición relativa de un ítem dado o sobre el grado en que los valores se extienden alrededor de una media.

    Por ejemplo, las distribuciones

    • 7, 8, 8, 9 y
    • 1, 3, 11, 17

    tienen la misma media, a saber, 8. Pero los ítems de la primera distribución se agrupan mucho más estrechamente alrededor de la media que los de la segunda. Si los valores en una distribución están bastante dispersos, entonces la media puede no ser muy informativa. Las medidas de dispersión proporcionan información adicional; nos dicen qué tan dispersos (“dispersos”) están los valores en una distribución.

    El rango es la distancia entre el valor más grande y el más pequeño en la distribución. En la distribución: 179, 193, 99, 311, 193, 194, 179, el rango es la distancia entre 311 y 99, es decir, 311- 99 = 212.

    Percentiles

    A menudo un valor numérico o puntaje no te dice mucho en sí mismo. Si aprendes que obtuviste un 685 en el componente matemático del ACT o que obtuviste un 86 en el primer examen de este curso, eso realmente no te dice lo bien que te fue. Lo que quieres saber es lo bien que te fue en comparación con quienes tomaron el mismo examen. Los percentiles proporcionan información sobre dichas posiciones relativas. El rango percentil de un valor o puntaje es el porcentaje de valores que caen por debajo de él. Por ejemplo, si Sandra obtuvo un 86% en el primer examen y el 75% de la clase obtuvo calificaciones más bajas, entonces la puntuación de Sandra tiene un rango de percentil de 75%. Y su puntuación, 86, cae en, o es, el percentil 75.

    Los percentiles proporcionan posiciones relativas en términos porcentuales. Por ejemplo, supongamos que 100 personas hacen el primer examen y que Wilbur obtiene un 79%. Si 60 (= 60%) los estudiantes obtuvieron una puntuación inferior a 79, entonces la puntuación de Wilbur de 79 cae en el percentil 60.

    Los cuartiles funcionan como la mediana. El primer cuartil es el valor tal que 1/4 de los valores son menores que él, el segundo cuartil el valor tal que la mitad de los valores son menores que él (este número es también la mediana), el tercer cuartil el valor tal que 3/4 de los valores son menores que él. El primer cuartil cae en el percentil 25. La desviación estándar es una medida muy importante de dispersión. No podemos calcularlo sin una fórmula (que no nos preocuparemos aquí), pero la idea intuitiva es que la desviación estándar mida la distancia promedio de todos los valores desde la media. Nos dice hasta qué punto, en promedio, los valores se desvían del valor medio o promedio en la distribución. Cuanto mayor es la desviación estándar, más dispersos están los valores. De ahí que aunque las distribuciones 7, 8, 8, 9 y 1, 3, 11, 17 tengan la misma media, es decir, 8, la primera tendrá una desviación estándar menor que la segunda.

    Ejercicios

    1. Encuentre la media, mediana, modo y rango de cada una de las siguientes distribuciones (que podemos considerar como medidas del peso de las personas en libras):
      1. 176, 132, 221, 187, 132, 194, 190
      2. 176, 193, 99.5, 321, 112, 200, 120

    Aquí hay una lista de personas en una clase, su puntaje en su final, y el porcentaje de personas que anotaron por debajo de ellos. En cada caso, dar el percentil donde cae su grado.

    1. Olivia obtuvo un 97%, 95% anotó menor.
    2. Erik obtuvo un 46%, 5% anotó a la baja.
    3. Wilbur obtuvo un 85%, 80% anotó menos.
    4. ¿Qué distribución tendrá la mayor desviación estándar?
      • 10, 11, 14, 9
      • 6, 9.5, 10, 18.6

    This page titled 15.1: Estadística Descriptiva is shared under a CC BY-NC 4.0 license and was authored, remixed, and/or curated by Jason Southworth & Chris Swoyer via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.