Saltar al contenido principal
LibreTexts Español

2.4: Medidas de Tendencia Central (Igualidad)

  • Page ID
    150319
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    \( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)

    ( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\id}{\mathrm{id}}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\kernel}{\mathrm{null}\,}\)

    \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\)

    \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\)

    \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    \( \newcommand{\vectorA}[1]{\vec{#1}}      % arrow\)

    \( \newcommand{\vectorAt}[1]{\vec{\text{#1}}}      % arrow\)

    \( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vectorC}[1]{\textbf{#1}} \)

    \( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)

    \( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)

    \( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)

    \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    Hemos visto que podemos tener una idea de los datos trazando puntos en una gráfica, y haciendo un histograma. Estas herramientas nos muestran cómo son los números, aproximadamente qué tan grandes y pequeños son, y cuán similares y diferentes son de los demás. Es bueno tener una sensación sobre los números de esta manera. Pero, estos sentimientos visuales no son muy precisos. Además de resumir números con gráficas, podemos resumir números usando números (NO, por favor no más números, prometemos que los números pueden ser tu amigo).

    De muchos números a uno

    Las medidas de central tienen un objetivo de resumen importante: reducir un montón de números a un solo número que podamos ver. Ya sabemos que mirar miles de números es desesperado. ¿No sería bueno si pudiéramos mirar un número en su lugar? Nosotros creemos que sí. Resulta que hay muchas maneras de hacer esto. Entonces, si tu amigo alguna vez hace la pregunta aterradora, “oye, ¿cómo son todos estos números?”. Se puede decir que son así un número aquí mismo.

    Pero, al igual que en Indiana Jones y la Última Cruzada (película muy recomendable), debes elegir sabiamente tu medida de tendencia central.

    Modo

    El modo es el número que ocurre con mayor frecuencia en su medición. Eso es. ¿Cómo lo encuentras? Tienes que contar el número de veces que cada número aparece en tu medida, entonces el que más ocurra, es el modo.

    Ejemplo: 1 1 2 3 4 5 6

    El modo del conjunto anterior es 1, que ocurre tres veces. Cada otro número solo ocurre una vez.

    Bien bien. Qué sucede aquí:

    Ejemplo: 1 1 1 2 2 2 3 4 5 6

    Mmm, ahora 1 y 2 ocurren ambos tres veces cada uno. ¿Qué hacemos? Nosotros decimos que hay dos modos, y son 1 y 2.

    ¿Por qué el modo es una medida de tendencia central? Bueno, cuando preguntamos “como son mis números”, podemos decir, “la mayoría de los números son, como un 1 (o lo que sea el modo)”.

    ¿Es el modo una buena medida de tendencia central? Eso depende de tus números. Por ejemplo, considere estos números

    1 1 2 3 4 5 6 7 8 9

    Aquí, el modo es 1 nuevamente, porque hay dos 1s, y todos los demás números ocurren una vez. Pero, son la mayoría de los números como, un 1. No, en su mayoría no son 1s.

    “Argh, entonces ¿debería o no debería usar el modo? Pensé que esta clase se suponía que iba a decirme qué hacer?”. No hay que decirle qué hacer. Cada vez que usas una herramienta en estadística tienes que pensar en lo que estás haciendo y justificar por qué tiene sentido lo que estás haciendo. Lo siento.

    Mediana

    La mediana es la mitad exacta de los datos. Después de todo, estamos preguntando por tendencia central, entonces, ¿por qué no ir al centro de los datos y ver dónde estamos? ¿A qué te refieres con la mitad de los datos? Veamos estos números:

    1 5 4 3 6 7 9

    Umm, bien. Entonces, ¿tres está en el medio? No es ese tipo de arbitrario. Sí. Antes de que podamos calcular la mediana, necesitamos ordenar los números de menor a mayor.

    1 3 4 5 6 7 9

    Ahora, 5 está en el medio. Y, por medio nos referimos a la mitad. Hay tres números a la izquierda de 5, y tres números a la derecha. Entonces, cinco definitivamente está en el medio.

    Bien bien, pero ¿qué pasa cuando no hay un número par de números? Entonces el medio va a faltar ¿verdad? Veamos:

    1 2 3 4 5 6

    No hay número entre 3 y 4 en los datos, el medio está vacío. En este caso, calculamos la mediana calculando el número entre 3 y 4. Entonces, la mediana sería 3.5.

    ¿Es la mediana una buena medida de la tendencia central? Seguro, muchas veces es muy útil. Una propiedad de la mediana es que se queda en el medio incluso cuando algunos de los otros números se ponen realmente raros. Por ejemplo, considere estos números:

    1 2 3 4 4 4 5 6 6 6 7 7 1000

    La mayoría de estos números son pequeños, pero el 1000 es un gran número extraño viejo, muy diferente al resto. La mediana sigue siendo de 5, porque está en la mitad de estos números ordenados. También podemos ver que cinco es bastante similar a la mayoría de los números (excepto 1000). Entonces, la mediana hace un trabajo bastante bueno al representar la mayoría de los números en el conjunto, y lo hace incluso si uno o dos de los números son muy diferentes de los demás.

    Por último, atípico es un término que usaremos para describir números que aparecen en datos que son muy diferentes del resto. 1000 es un valor atípico, porque se encuentra muy por ahí en la recta numérica en comparación con los otros números. Qué hacer con los valores atípicos es otro tema que discutimos a veces a lo largo de este curso.

    Media

    ¿Te has dado cuenta de que este es un libro de texto sobre estadísticas que aún no ha usado una fórmula? Eso está a punto de cambiar, pero para aquellos de ustedes con ansiedad por fórmulas, no se preocupen, haremos todo lo posible para explicarlas.

    A la media también se le llama promedio. Y, estamos adivinando que ya podrías ahora ¿cuál es el promedio de un montón de números? Es la suma de los números, dividido por el número de número ¿verdad? ¿Cómo expresamos esa idea en una fórmula? Así como esto:

    \[ \text{Mean} = \bar{X} = \frac{\sum_{i=1}^{n} x_{i}}{N} \label{mean} \]

    “Eso me parece griego”. Sip. El\(\sum\) símbolo se llama sigma, y significa la operación de sumar. El pequeño “\(i\)” en la parte inferior, y el pequeño “\(n\)” en la parte superior se refiere a todos los números del conjunto, desde el primer número “\(i\)” hasta el último número “\(n\)”. Las letras son solo etiquetas arbitrarias, llamadas variables que utilizamos con fines descriptivos. El\(x_{i}\) se refiere a números individuales en el conjunto. Resumimos todos los números, luego dividimos la suma por\(N\), que es el número total de números. En ocasiones verás\(\bar{X}\) hacer referencia a la media de todos los números.

    En inglés sencillo, la fórmula se ve así:

    \[\text{Mean} = \dfrac{\text{Sum of my numbers}}{\text{Count of my numbers}} \nonumber \]

    “Bueno, ¿por qué no acabas de decir eso?”. Acabamos de hacer en la Ecuación\ ref {media}.

    Vamos a calcular la media para estos cinco números:

    3 7 9 2 6

    Sumar em up:

    3+7+9+2+6 = 27

    Contar em arriba:

    \(i_{1}\)= 3,\(i_{2}\) = 7,\(i_{3}\) = 9,\(i_{4}\) = 2,\(i_{5}\) = 6; N=5, porque\(i\) pasó de 1 a 5

    Dividir em:

    media = 27/5 = 5.4

    O bien, para poner los números en la fórmula, se ve así:

    \[ \text{Mean} = \bar{X} = \frac{\sum_{i=1}^{n} x_{i}}{N} = \frac{3+7+9+2+6}{5} = \frac{27}{5} = 5.4 \nonumber \]

    Bien bien, así es como computar la media. Pero, como imaginamos, probablemente ya lo sabías, y si no lo hiciste eso está bien, ahora lo haces. ¿Cuál es el siguiente?

    ¿Es la media una buena medida de tendencia central? A estas alturas, ya debes saber: depende.

    ¿Qué significa the?

    No basta con conocer la fórmula de la media, o poder usar la fórmula para calcular una media para un conjunto de números. Creemos en su capacidad para sumar y dividir números. Lo que realmente necesitas saber es qué significa realmente “significa” la media. Esto requiere que sepas lo que hace la media, y no solo cómo hacerlo. ¿Desconcertado? Vamos a explicar.

    ¿Puedes responder a esta pregunta: ¿Qué sucede cuando divides una suma de números por el número de números? ¿Cuáles son las consecuencias de hacer esto? ¿Qué está haciendo la fórmula? ¿Qué tipo de propiedades nos da el resultado? FYI, la respuesta no es que calculemos la media.

    Bien, entonces, ¿qué pasa cuando divides algún número por otro número? Por supuesto, la palabra clave aquí es dividir. Literalmente tallamos el número arriba en el numerador en pedazos. ¿Cuántas veces dividimos el número superior? Eso depende del número inferior en el denominador. Ver:

    \[ \frac{12}{3} = 4 \nonumber \]

    Entonces, sabemos que la respuesta es 4. Pero, lo que realmente está pasando aquí es que estamos cortando y cortando 12, ¿no? Sí, y cortamos 12 en tres partes. Resulta que el tamaño de esas tres partes es 4. Entonces, ahora estamos pensando en 12 como tres piezas diferentes\(12 = 4 + 4 + 4\). Sé que esto será obvio, pero ¿qué tipo de propiedades tienen nuestras piezas? ¿Te refieres a los cuatro? Sip. Bueno, obviamente son todos cuatro patas. Sí. Las piezas son todas del mismo tamaño. Todos son iguales. Entonces, la división iguala al numerador por el denominador...

    “Umm, creo que aprendí esto en la primaria, ¿qué tiene que ver esto con la media?”. El número en la parte superior de la fórmula para la media es solo otro numerador dividido por un denominador, ¿no es así? En este caso, el numerador es una suma de todos los valores en tus datos. ¿Y si fuera la suma de todas las 500 calificaciones de felicidad? La suma de todos ellos sería sólo un solo número sumando todas las diferentes calificaciones. Si dividiéramos la suma en partes iguales representando una parte para la felicidad de cada persona, ¿qué obtendríamos? Obtendríamos 500 números idénticos e iguales para cada persona. Sería como tomar toda la felicidad del mundo, luego dividirla por igual, luego para ser justos, devolviéndole la misma cantidad igual de felicidad a todos en el mundo. Esto haría que algunas personas fueran más felices de lo que estaban antes, y algunas personas menos felices bien. Por supuesto, eso es porque sería igualar la distribución de la felicidad para todos. Este proceso de ecualización dividiendo algo en partes iguales es lo que hace la media. Ves, es más que una simple fórmula. Es una idea. Esto es solo el comienzo de pensar en este tipo de ideas. Volveremos a esta idea sobre la media, y otras ideas, en capítulos posteriores.

    Consejo profesional: La media es el único número que puede ocupar el lugar de cada número en los datos, de tal manera que cuando sumas todas las partes iguales, recuperas la suma original de los datos.

    Todos juntos ahora

    Solo para recordarnos el modo, la mediana y la media, echemos un vistazo al siguiente histograma. Hemos superpuesto la ubicación de la media (rojo), mediana (verde) y modo (azul). Para este conjunto de datos, las tres medidas de tendencia central dan respuestas diferentes. La media es la mayor porque está influenciada por grandes números, aunque se presenten raramente. El modo y la mediana son insensibles a números grandes que ocurren con poca frecuencia, por lo que tienen valores más pequeños.

    library(ggplot2)
    my_mode <- function(x) {
      ux <- unique(x)
      ux[which.max(tabulate(match(x, ux)))]
    }
    exp_num<-round(rexp(1000,.15),digits=1)
    qplot(exp_num, col=I("grey"), fill=I("white"), bins=30)+
      geom_vline(xintercept=mean(exp_num), color="red", size=1.5)+
      geom_vline(xintercept=median(exp_num), color="green", size=1.5)+
      geom_vline(xintercept=my_mode(exp_num), color="blue", size=1.5)+
      theme_classic()
    Figura\(\PageIndex{1}\): Un histograma con la media (rojo), la mediana (verde) y el modo (azul)

    This page titled 2.4: Medidas de Tendencia Central (Igualidad) is shared under a CC BY-SA 4.0 license and was authored, remixed, and/or curated by Matthew J. C. Crump via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.