Saltar al contenido principal
LibreTexts Español

2.3: Medidas del Centro de Datos

  • Page ID
    150792
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    El “centro” de un conjunto de datos también es una forma de describir la ubicación. Las dos medidas más utilizadas del “centro” de los datos son la media (promedio) y la mediana. Para calcular el peso medio de 50 personas, sumar los 50 pesos juntos y dividir por 50. Técnicamente esta es la media aritmética. Discutiremos la media geométrica más adelante. Para encontrar el peso medio de las 50 personas, ordene los datos y encuentre el número que divide los datos en dos partes iguales, lo que significa un número igual de observaciones en cada lado. El peso de 25 personas está por debajo de este peso y 25 personas son más pesadas que este peso. La mediana es generalmente una mejor medida del centro cuando hay valores extremos o valores atípicos porque no se ve afectada por los valores numéricos precisos de los valores atípicos. La media es la medida más común del centro.

    NOTA

    Las palabras “media” y “promedio” a menudo se usan indistintamente. La sustitución de una palabra por otra es práctica común. El término técnico es “media aritmética” y “promedio” es técnicamente una ubicación central. Formalmente, la media aritmética es llamada el primer momento de la distribución por los matemáticos. Sin embargo, en la práctica entre los no estadísticos, el “promedio” es comúnmente aceptado para la “media aritmética”.

    Cuando cada valor en el conjunto de datos no es único, la media se puede calcular multiplicando cada valor distinto por su frecuencia y luego dividiendo la suma por el número total de valores de datos. La letra utilizada para representar la media de la muestra es una x con una barra sobre ella (pronunciada “\(x\)barra”):\(\overline x\).

    La letra griega\(\mu\) (pronunciada “mew”) representa la media poblacional. Uno de los requisitos para que la media muestral sea una buena estimación de la media poblacional es que la muestra tomada sea verdaderamente aleatoria.

    Para ver que ambas formas de calcular la media son las mismas, considera la muestra:
    1; 1; 2; 2; 3; 4; 4; 4; 4; 4; 4; 4

    \[\overline{x}=\frac{1+1+1+2+2+3+4+4+4+4+4}{11}=2.7\nonumber\]

    \[\overline{x}=\frac{3(1)+2(2)+1(3)+5(4)}{11}=2.7\nonumber\]

    En el segundo cálculo, las frecuencias son 3, 2, 1 y 5.

    Puede encontrar rápidamente la ubicación de la mediana mediante el uso de la expresión\(\frac{n+1}{2}\).

    La letra\(n\) es el número total de valores de datos en la muestra. Si\(n\) es un número impar, la mediana es el valor medio de los datos ordenados (ordenados de menor a mayor). Si\(n\) es un número par, la mediana es igual a los dos valores medios que se suman y se dividen por dos después de que se hayan ordenado los datos. Por ejemplo, si el número total de valores de datos es 97, entonces\(\frac{n+1}{2}=\frac{97+1}{2}=49\). La mediana es el 49 º valor en los datos ordenados. Si el número total de valores de datos es 100, entonces\(\frac{n+1}{2}=\frac{100+1}{2}=50.5\). La mediana se presenta a mitad de camino entre los valores 50 y 51 st. La ubicación de la mediana y el valor de la mediana no son lo mismo. La letra mayúscula\(M\) se utiliza a menudo para representar la mediana. El siguiente ejemplo ilustra la ubicación de la mediana y el valor de la mediana.

    Ejemplo 2.24

    Los datos sobre el SIDA que indican el número de meses que vive un paciente con SIDA después de tomar un nuevo fármaco anticuerpo son los siguientes (de menor a mayor):
    3; 4; 8; 8; 10; 11; 12; 13; 14; 15; 15; 16; 16; 17; 18; 21; 22; 22; 24; 24; 25; 26; 26; 27; 27; 29; 29; 29; 31; 32; 33; 33; 34;; 35; 37; 40; 44; 44; 47;
    Calcular la media y la mediana.

    Contestar

    Solución 2.24

    El cálculo para la media es:

    \(\overline{x}=\frac{[3+4+(8)(2)+10+11+12+13+14+(15)(2)+\ldots+35+37+40+(44)(2)+47]}{40}=23.6\)
    Para encontrar la mediana,\(M\), primero usa la fórmula para la ubicación. La ubicación es:
    \(\frac{n+1}{2}=\frac{40+1}{2}=20.5\)
    Comenzando en el valor más pequeño, la mediana se ubica entre los valores 20 y 21 st (los dos 24s):
    \(3; 4; 8; 8; 10; 11; 12; 13; 14; 15; 15; 16; 16; 17; 17; 18; 21; 22; 22; 24; 24; 25; 26; 26; 27; 27; 29; 29; 31; 32; 33; 33; 34; 34; 35; 37; 40; 44; 44; 47;\)

    \(M=\frac{24+24}{2}=24\)

    Ejemplo 2.25

    Supongamos que en un pequeño pueblo de 50 personas, una persona gana $5,000,000 anuales y la otra 49 gana cada una $30.000. ¿Cuál es la mejor medida del “centro”: la media o la mediana?

    Contestar

    Solución 2.25

    \(\overline{x}=\frac{5,000,000+49(30,000)}{50}=129,400\)

    \(M = 30,000\)

    (Hay 49 personas que ganan 30,000 dólares y una persona que gana $5,000,000.)

    La mediana es una mejor medida del “centro” que la media porque 49 de los valores son 30,000 y uno es 5,000,000. El 5,000,000 es un valor atípico. El 30,000 nos da una mejor idea de la mitad de los datos.

    Otra medida del centro es el modo. El modo es el valor más frecuente. Puede haber más de un modo en un conjunto de datos siempre que esos valores tengan la misma frecuencia y esa frecuencia sea la más alta. Un conjunto de datos con dos modos se llama bimodal.

    Ejemplo 2.26

    Las puntuaciones de los exámenes de estadística para 20 alumnos son las siguientes:

    50; 53; 59; 59; 63; 63; 72; 72; 72; 72; 72; 76; 78; 81; 83; 84; 84; 84; 90; 93

    Encuentra el modo.

    Contestar

    Solución 2.26

    El puntaje más frecuente es de 72, lo que ocurre cinco veces. Modo = 72.

    Ejemplo 2.27

    Cinco calificaciones de exámenes de bienes raíces son 430, 430, 480, 480, 495. El conjunto de datos es bimodal porque las puntuaciones 430 y 480 ocurren cada una dos veces.

    ¿Cuándo es el modo la mejor medida del “centro”? Considera un programa de pérdida de peso que anuncie una pérdida de peso media de seis libras la primera semana del programa. El modo podría indicar que la mayoría de las personas pierden dos libras la primera semana, haciendo que el programa sea menos atractivo.

    NOTA

    El modo se puede calcular tanto para datos cualitativos como para datos cuantitativos. Por ejemplo, si el conjunto de datos es: rojo, rojo, rojo, verde, verde, amarillo, morado, negro, azul, el modo es rojo.

    Cálculo de la media aritmética de tablas de frecuencias agrupadas

    Cuando solo hay datos agrupados disponibles, no se conocen los valores de datos individuales (solo conocemos intervalos y frecuencias de intervalo); por lo tanto, no se puede calcular una media exacta para el conjunto de datos. Lo que debemos hacer es estimar la media real calculando la media de una tabla de frecuencias. Una tabla de frecuencias es una representación de datos en la que se muestran datos agrupados junto con las frecuencias correspondientes. Para calcular la media a partir de una tabla de frecuencias agrupadas podemos aplicar la definición básica de media: media = Simplemente\(\frac{\text { data sum }}{\text { number of data values }}\) necesitamos modificar la definición para que encaje dentro de las restricciones de una tabla de frecuencias.

    Como no conocemos los valores de datos individuales podemos encontrar el punto medio de cada intervalo. El punto medio es\(\frac{\text { lower boundary+upper boundary}}{2}\). Ahora podemos modificar la definición de media para que sea\(\textbf{Mean of Frequency Table}=\frac{\sum f m}{\sum f}\) donde f = la frecuencia del intervalo y m = el punto medio del intervalo.

    Ejemplo 2.28

    Se muestra una tabla de frecuencias que muestra la última prueba estadística del profesor Blount. Encuentra la mejor estimación de la media de clase.

    Intervalo de grado Número de alumnos
    50—56.5 1
    56.5—62.5 0
    62.5—68.5 4
    68.5—74.5 4
    74.5—80.5 2
    80.5—86.5 3
    86.5—92.5 4
    92.5—98.5 1
    Cuadro 2.24
    Contestar

    Solución 2.28

    Encuentra los puntos medios para todos los intervalos
    Intervalo de grado Punto medio
    50—56.5 53.25
    56.5—62.5 59.5
    62.5—68.5 65.5
    68.5—74.5 71.5
    74.5—80.5 77.5
    80.5—86.5 83.5
    86.5—92.5 89.5
    92.5—98.5 95.5
    Cuadro 2.25
    • Calcular la suma del producto de cada intervalo de frecuencia y punto medio. \(\sum f m\)\(53.25(1)+59.5(0)+65.5(4)+71.5(4)+77.5(2)+83.5(3)+89.5(4)+95.5(1)=1460.25\)
    • \(\mu=\frac{\sum f m}{\sum f}=\frac{1460.25}{19}=76.86\)

    Ejercicio 2.28

    Maris realizó un estudio sobre el efecto que el juego de videojuegos tiene en el recuerdo de la memoria. Como parte de su estudio, recopiló los siguientes datos:

    Horas que los adolescentes pasan en videojuegos Número de adolescentes
    0—3.5 3
    3.5—7.5 7
    7.5—11.5 12
    11.5—15.5 7
    15.5—19.5 9
    Cuadro 2.26

    ¿Cuál es la mejor estimación para el número medio de horas dedicadas a jugar videojuegos?


    This page titled 2.3: Medidas del Centro de Datos is shared under a CC BY 4.0 license and was authored, remixed, and/or curated by OpenStax via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.