2.6: Medidas del Centro de Datos

Última actualización
Guardar como PDF

Page ID: 153257

$ \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } $ $ \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} $$\newcommand{\id}{\mathrm{id}}$ $ \newcommand{\Span}{\mathrm{span}}$ $ \newcommand{\kernel}{\mathrm{null}\,}$ $ \newcommand{\range}{\mathrm{range}\,}$ $ \newcommand{\RealPart}{\mathrm{Re}}$ $ \newcommand{\ImaginaryPart}{\mathrm{Im}}$ $ \newcommand{\Argument}{\mathrm{Arg}}$ $ \newcommand{\norm}[1]{\| #1 \|}$ $ \newcommand{\inner}[2]{\langle #1, #2 \rangle}$ $ \newcommand{\Span}{\mathrm{span}}$ $\newcommand{\id}{\mathrm{id}}$ $ \newcommand{\Span}{\mathrm{span}}$ $ \newcommand{\kernel}{\mathrm{null}\,}$ $ \newcommand{\range}{\mathrm{range}\,}$ $ \newcommand{\RealPart}{\mathrm{Re}}$ $ \newcommand{\ImaginaryPart}{\mathrm{Im}}$ $ \newcommand{\Argument}{\mathrm{Arg}}$ $ \newcommand{\norm}[1]{\| #1 \|}$ $ \newcommand{\inner}[2]{\langle #1, #2 \rangle}$ $ \newcommand{\Span}{\mathrm{span}}$$\newcommand{\AA}{\unicode[.8,0]{x212B}}$

El “centro” de un conjunto de datos también es una forma de describir la ubicación. Las dos medidas más utilizadas del “centro” de los datos son la media (promedio) y la mediana. Para calcular el peso medio de 50 personas, sumar los 50 pesos juntos y dividir por 50. Para encontrar el peso medio de las 50 personas, ordenar los datos y encontrar el número que divide los datos en dos partes iguales. La mediana es generalmente una mejor medida del centro cuando hay valores extremos o valores atípicos porque no se ve afectada por los valores numéricos precisos de los valores atípicos. La media es la medida más común del centro.

Las palabras “media” y “promedio” a menudo se usan indistintamente. La sustitución de una palabra por otra es práctica común. El término técnico es “media aritmética” y “promedio” es técnicamente una ubicación central. Sin embargo, en la práctica entre los no estadísticos, el “promedio” es comúnmente aceptado para la “media aritmética”.

Cuando cada valor en el conjunto de datos no es único, la media se puede calcular multiplicando cada valor distinto por su frecuencia y luego dividiendo la suma por el número total de valores de datos. La letra utilizada para representar la media de la muestra es una$x$ con una barra sobre ella (pronunciada “$x$barra”):$\overline{x}$.

La letra griega$\mu$ (pronunciada “mew”) representa la media poblacional. Uno de los requisitos para que la media muestral sea una buena estimación de la media poblacional es que la muestra tomada sea verdaderamente aleatoria.

Para ver que ambas formas de calcular la media son las mismas, considera la muestra:

1; 1; 1; 2; 2; 3; 4; 4; 4; 4; 4; 4

\[\bar{x} = \dfrac{1+1+1+2+2+3+4+4+4+4+4}{11} = 2.7\]

\[\bar{x} = \dfrac{3(1) + 2(2) + 1(3) + 5(4)}{11} = 2.7\]

En el segundo cálculo, las frecuencias son 3, 2, 1 y 5.

Puede encontrar rápidamente la ubicación de la mediana usando la expresión

\[\dfrac{n+1}{2}\]

La letra$n$ es el número total de valores de datos en la muestra. Si$n$ es un número impar, la mediana es el valor medio de los datos ordenados (ordenados de menor a mayor). Si$n$ es un número par, la mediana es igual a los dos valores medios que se suman y se dividen por dos después de que se hayan ordenado los datos. Por ejemplo, si el número total de valores de datos es 97, entonces

\[\dfrac{n+1}{2} = \dfrac{97+1}{2} = 49.\]

La mediana es el 49 ^º valor en los datos ordenados. Si el número total de valores de datos es 100, entonces

\[\dfrac{n+1}{2} = \dfrac{100+1}{2} = 50.5.\]

La mediana ocurre a mitad de camino entre los ^valores 50 y 51 ^st. La ubicación de la mediana y el valor de la mediana no son lo mismo. La letra mayúscula$M$ se utiliza a menudo para representar la mediana. El siguiente ejemplo ilustra la ubicación de la mediana y el valor de la mediana.

Ejemplo$\PageIndex{1}$

Los datos sobre el SIDA que indican el número de meses que vive un paciente con SIDA después de tomar un nuevo fármaco de anticuerpos son los siguientes (de menor a mayor):

3; 4; 8; 8; 10; 11; 12; 13; 14; 15; 15; 16; 16; 16; 17; 17; 18; 21; 22; 22; 24; 24; 25; 26; 26; 27; 27; 29; 29; 31; 32; 33; 33; 34; 34; 35; 37; 40; 44; 44; 47

Calcular la media y la mediana.

Contestar

El cálculo para la media es:

\[\bar{x} = \dfrac{[3+4+(8)(2)+10+11+12+13+14+(15)(2)+(16)(2)+...+35+37+40+(44)(2)+47]}{40} = 23.6\]

Para encontrar la mediana,$M$, primero usa la fórmula para la ubicación. La ubicación es:

\[\dfrac{n+1}{2} = \dfrac{40+1}{2} = 20.5\]

Comenzando en el valor más pequeño, la mediana se ubica entre los valores 20 ^th y 21 ^st (los dos 24s):

3; 4; 8; 8; 10; 11; 12; 13; 14; 15; 15; 16; 16; 16; 17; 17; 18; 21; 22; 22; 24; 24; 25; 26; 26; 27; 27; 29; 29; 31; 32; 33; 33; 34; 34; 35; 37; 40; 44; 44; 47

\[M = \dfrac{24+24}{2} = 24\]

Calculadora

Para encontrar la media y la mediana:

Borrar lista L1. Pres STAT 4:CLRList. Ingresa 2nd 1 para la lista L1. Presione ENTER.

Ingresa datos en el editor de listas. Presione STAT 1:EDIT.

Poner los valores de los datos en la lista L1.

Presione STAT y flecha hacia CALC. Prensa 1:1 -VarStats. Presiona 2nd 1 para L1 y luego ENTRAR.

Presiona las teclas de flecha hacia abajo y hacia arriba para desplazarte.

$\bar{x}$= 23.6, M = 24

Ejercicio$\PageIndex{1}$

Los siguientes datos muestran el número de meses que los pacientes suelen esperar en una lista de trasplantes antes de ser operados. Los datos se ordenan de menor a mayor. Calcular la media y la mediana.

3; 4; 5; 7; 7; 7; 7; 8; 8; 9; 9; 10; 10; 10; 10; 10; 10; 11; 12; 12; 13; 14; 14; 15; 15; 17; 17; 17; 18; 19; 19; 21; 21; 22; 22; 23; 24; 24; 24; 24; 24; 24

Responder

Media:$3 + 4 + 5 + 7 + 7 + 7 + 7 + 8 + 8 + 9 + 9 + 10 + 10 + 10 + 10 + 10 + 11 + 12 + 12 + 13 + 14 + 14 + 15 + 15 + 17 + 17 + 18 + 19 + 19 + 19 + 21 + 21 + 22 + 22 + 23 + 24 + 24 + 24 = 544$

\[\dfrac{544}{39} = 13.95\]

Mediana: Comenzando por el valor más pequeño, la mediana es el ^término 20, que es 13.

Ejemplo$\PageIndex{2}$

Supongamos que en un pequeño pueblo de 50 personas, una persona gana $5,000,000 anuales y la otra 49 gana cada una $30.000. ¿Cuál es la mejor medida del “centro”: la media o la mediana?

Solución

\[\bar{x} = \dfrac{5,000,000+49(30,000)}{50} = 129,400\]

$M = 30,000$

(Hay 49 personas que ganan 30,000 dólares y una persona que gana $5,000,000.)

La mediana es una mejor medida del “centro” que la media porque 49 de los valores son 30,000 y uno es 5,000,000. El 5,000,000 es un valor atípico. El 30,000 nos da una mejor idea de la mitad de los datos.

Ejercicio$\PageIndex{2}$

En una muestra de 60 hogares, una casa vale $2,500,000. La mitad del resto valen 280.000 dólares, y todos los demás valen $315,000. ¿Cuál es la mejor medida del “centro”: la media o la mediana?

Responder

La mediana es la mejor medida del “centro” que la media porque 59 de los valores son 280.000 dólares y uno es $2,500,000. El $2,500,000 es un valor atípico. Ya sea 280,000 o $315,000 nos da una mejor idea de la mitad de los datos.

Otra medida del centro es el modo. El modo es el valor más frecuente. Puede haber más de un modo en un conjunto de datos siempre que esos valores tengan la misma frecuencia y esa frecuencia sea la más alta. Un conjunto de datos con dos modos se llama bimodal.

Ejemplo$\PageIndex{3}$

Los resultados de los exámenes estadísticos para 20 alumnos son los siguientes:

50; 53; 59; 59; 63; 63; 72; 72; 72; 72; 72; 76; 78; 81; 83; 84; 84; 84; 90; 93

Encuentra el modo.

Responder

El puntaje más frecuente es de 72, lo que ocurre cinco veces. Modo = 72.

Ejercicio$\PageIndex{3}$

El número de libros extraídos de la biblioteca de 25 alumnos son los siguientes:

0; 0; 0; 1; 2; 3; 3; 4; 4; 5; 5; 7; 7; 7; 7; 7; 8; 8; 8; 9; 10; 10; 11; 11; 12; 12

Encuentra el modo.

Responder

El número más frecuente de libros es de 7, lo que ocurre cuatro veces. Modo = 7.

Ejemplo$\PageIndex{4}$

Cinco calificaciones de exámenes de bienes raíces son 430, 430, 480, 480, 495. El conjunto de datos es bimodal porque las puntuaciones 430 y 480 ocurren cada una dos veces.

¿Cuándo es el modo la mejor medida del “centro”? Considera un programa de pérdida de peso que anuncie una pérdida de peso media de seis libras la primera semana del programa. El modo podría indicar que la mayoría de las personas pierden dos libras la primera semana, haciendo que el programa sea menos atractivo.

El modo se puede calcular tanto para datos cualitativos como para datos cuantitativos. Por ejemplo, si el conjunto de datos es: rojo, rojo, rojo, verde, verde, amarillo, morado, negro, azul, el modo es rojo.

El software estadístico calculará fácilmente la media, la mediana y el modo. Algunas calculadoras gráficas también pueden hacer estos cálculos. En el mundo real, la gente hace estos cálculos utilizando software.

Ejercicio$\PageIndex{4}$

Cinco puntajes crediticios son 680, 680, 700, 720, 720. El conjunto de datos es bimodal porque los puntajes 680 y 720 ocurren dos veces cada uno. Considera las ganancias anuales de los trabajadores de una fábrica. El modo es de $25,000 y ocurre 150 veces de 301. La mediana es de 50,000 dólares y la media es de 47,500 dólares. ¿Cuál sería la mejor medida del “centro”?

Responder

Debido a que $25,000 ocurren casi la mitad del tiempo, el modo sería la mejor medida del centro porque la mediana y la media no representan lo que la mayoría de la gente hace en la fábrica.

La ley de los números grandes y la media

La Ley de Grandes Números dice que si se toman muestras de mayor y mayor tamaño de cualquier población, entonces es muy probable que la media$\bar{x}$ de la muestra se acerque cada vez más$\mu$. Esto se discute con más detalle más adelante en el texto.

Distribuciones de muestreo y estadística de una distribución de muestreo

Se puede pensar en una distribución de muestreo como una distribución de frecuencia relativa con una gran cantidad de muestras. (Ver Muestreo y Datos para una revisión de la frecuencia relativa). Supongamos que a treinta estudiantes seleccionados al azar se les preguntó el número de películas que vieron la semana anterior. Los resultados se encuentran en la tabla de frecuencias relativas que se muestra a continuación.

# de películas	Frecuencia relativa
0	$\dfrac{5}{30}$
1	$\dfrac{15}{30}$
2	$\dfrac{6}{30}$
3	$\dfrac{3}{30}$
4	$\dfrac{1}{30}$

Si dejas que el número de muestras sea muy grande (digamos, 300 millones o más), la tabla de frecuencias relativas se convierte en una distribución de frecuencia relativa.

Un estadístico es un número calculado a partir de una muestra. Los ejemplos estadísticos incluyen la media, la mediana y el modo, así como otros. La media muestral$\bar{x}$ es un ejemplo de un estadístico que estima la media poblacional$\mu$.

Cálculo de la media de tablas de frecuencias agrupadas

Cuando solo hay datos agrupados disponibles, no se conocen los valores de datos individuales (solo conocemos intervalos y frecuencias de intervalo); por lo tanto, no se puede calcular una media exacta para el conjunto de datos. Lo que debemos hacer es estimar la media real calculando la media de una tabla de frecuencias. Una tabla de frecuencias es una representación de datos en la que se muestran datos agrupados junto con las frecuencias correspondientes. Para calcular la media a partir de una tabla de frecuencias agrupadas podemos aplicar la definición básica de media:

\[mean = \dfrac{\text{data sum}}{\text{number of data values}}.\]

Simplemente necesitamos modificar la definición para que encaje dentro de las restricciones de una tabla de frecuencias.

Como no conocemos los valores de datos individuales podemos encontrar el punto medio de cada intervalo. El punto medio es

\[\dfrac{\text{lower boundary+upper boundary}}{2}.\]

Ahora podemos modificar la definición de media para ser

\[\text{Mean of Frequency Table} = \dfrac{\sum{fm}}{\sum{f}}\]

donde$f$ es la frecuencia del intervalo y$m $ es el punto medio del intervalo.

Ejemplo$\PageIndex{5}$

Se muestra una tabla de frecuencias que muestra la última prueba estadística del profesor Blount. Encuentra la mejor estimación de la media de clase.

Intervalo de Grado	Número de alumnos
50—56.5	1
56.5—62.5	0
62.5—68.5	4
68.5—74.5	4
74.5—80.5	2
80.5—86.5	3
86.5—92.5	4
92.5—98.5	1

Solución

Encuentra los puntos medios para todos los intervalos

Intervalo de Grado	Punto medio
50—56.5	53.25
56.5—62.5	59.5
62.5—68.5	65.5
68.5—74.5	71.5
74.5—80.5	77.5
80.5—86.5	83.5
86.5—92.5	89.5
92.5—98.5	95.5

Calcular la suma del producto de cada intervalo de frecuencia y punto medio. $\sum{fm} 53.25(1) + 59.5(0) + 65.5(4 )+ 71.5(4) + 77.5(2) + 83.5(3) + 89.5(4) + 95.5(1) = 1460.25$
$\mu = \dfrac{\sum{fm}}{\sum{f}} = \dfrac{1460.25}{19} = 76.86$

Ejercicio$\PageIndex{5}$

Maris realizó un estudio sobre el efecto que el juego de videojuegos tiene en el recuerdo de la memoria. Como parte de su estudio, recopiló los siguientes datos:

Horas que los adolescentes gastan en videojuegos	Número de adolescentes
0—3.5	3
3.5—7.5	7
7.5—11.5	12
11.5—15.5	7
15.5—19.5	9

¿Cuál es la mejor estimación para el número medio de horas dedicadas a jugar videojuegos?

Responder

Encontrar el punto medio de cada intervalo, multiplicar por el número correspondiente de adolescentes, sumar los resultados y luego dividir por el número total de adolescentes

Los puntos medios son 1.75, 5.5, 9.5, 13.5,17.5.

\[Mean = (1.75)(3) + (5.5)(7) + (9.5)(12) + (13.5)(7) + (17.5)(9) = 409.75\]

Referencias

Datos del Banco Mundial, disponibles en línea en http://www.worldbank.org (consultado el 3 de abril de 2013).
“Demografía: Obesidad — tasa de prevalencia en adultos”. Indexmundi. Disponible en línea en http://www.indexmundi.com/g/r.aspx?t=50&v=2228&l=en (consultado el 3 de abril de 2013).

Revisar

La media y la mediana se pueden calcular para ayudarle a encontrar el “centro” de un conjunto de datos. La media es la mejor estimación para el conjunto de datos real, pero la mediana es la mejor medida cuando un conjunto de datos contiene varios valores atípicos o valores extremos. El modo le indicará el dato (o datos) que ocurre con mayor frecuencia en su conjunto de datos. La media, la mediana y el modo son extremadamente útiles cuando necesita analizar sus datos, pero si su conjunto de datos consiste en rangos que carecen de valores específicos, la media puede parecer imposible de calcular. Sin embargo, la media se puede aproximar si se agrega el límite inferior con el límite superior y se divide por dos para encontrar el punto medio de cada intervalo. Multiplique cada punto medio por el número de valores encontrados en el rango correspondiente. Divida la suma de estos valores por el número total de valores de datos en el conjunto.

Revisión de Fórmula

\[\mu = \dfrac{\sum{fm}}{\sum{f}} \]

donde$f$ = frecuencias de intervalo y$m$ = puntos medios de intervalo.

Ejercicio 2.6.6

Encuentra la media para las siguientes tablas de frecuencias.

Grade	Frecuencia
49.5—59.5	2
59.5—69.5	3
69.5—79.5	8
79.5—89.5	12
89.5—99.5	5

Baja Temperatura Diaria	Frecuencia
49.5—59.5	53
59.5—69.5	32
69.5—79.5	15
79.5—89.5	1
89.5—99.5	0

Puntos por Juego	Frecuencia
49.5—59.5	14
59.5—69.5	32
69.5—79.5	15
79.5—89.5	23
89.5—99.5	2

Utilice la siguiente información para responder a los siguientes tres ejercicios: Los siguientes datos muestran las longitudes de embarcaciones amarradas en un puerto deportivo. Los datos se ordenan de menor a mayor: 16; 17; 19; 20; 20; 21; 23; 24; 25; 25; 25; 26; 26; 27; 27; 27; 28; 29; 30; 32; 33; 33; 34; 35; 37; 39; 40

Ejercicio 2.6.7

Calcular la media.

Responder

Media:$16 + 17 + 19 + 20 + 20 + 21 + 23 + 24 + 25 + 25 + 25 + 26 + 26 + 27 + 27 + 27 + 28 + 29 + 30 + 32 + 33 + 33 + 34 + 35 + 37 + 39 + 40 = 738$;

$\dfrac{738}{27} = 27.33$

Ejercicio 2.6.8

Identificar la mediana.

Ejercicio 2.6.9

Identificar el modo.

Responder

Las longitudes más frecuentes son 25 y 27, las cuales ocurren tres veces. Modo = 25, 27

Utilice la siguiente información para responder a los siguientes tres ejercicios: A sesenta y cinco vendedores de autos seleccionados al azar se les preguntó el número de autos que generalmente venden en una semana. Catorce personas respondieron que generalmente venden tres autos; diecinueve generalmente venden cuatro autos; doce generalmente venden cinco autos; nueve generalmente venden seis autos; once generalmente venden siete autos. Calcula lo siguiente:

Ejercicio 2.6.10

media de la muestra$\bar{x}$ = = _______

Ejercicio 2.6.11

mediana = _______

Responder

Uniéndolo

Ejercicio 2.6.12

Javier y Ercilia son supervisores en un centro comercial. A cada uno se le dio la tarea de estimar la distancia media que viven los compradores desde el centro comercial. Cada uno encuestó aleatoriamente a 100 compradores. Las muestras arrojaron la siguiente información.

	Javier	Ercilia
$\bar{x}$	6.0 millas	6.0 millas
s	4.0 millas	7.0 millas

¿Cómo se puede determinar qué encuesta fue la correcta?
Explique qué implica la diferencia en los resultados de las encuestas sobre los datos.
Si los dos histogramas representan la distribución de valores para cada supervisor, ¿cuál representa la muestra de Ercilia? ¿Cómo lo sabes?

Esto muestra dos histogramas. El primer histograma muestra una distribución bastante simétrica con un modo de 6. El segundo histograma muestra una distribución uniforme. — Figura$\PageIndex{1}$

Si las dos gráficas de caja representan la distribución de valores para cada supervisor, ¿cuál representa la muestra de Ercilia? ¿Cómo lo sabes? <figure >

Esto muestra dos diagramas de caja horizontales. La primera gráfica de caja se grafica sobre una recta numérica de 0 a 21. El primer bigote se extiende de 0 a 1. La caja comienza en el primer cuartil, 1, y termina en el tercer cuartil, 14. Una línea discontinua vertical marca la mediana en 6. El segundo bigote se extiende desde el tercer cuartil hasta el valor más grande, 21. La segunda gráfica de caja se grafica sobre una recta numérica de 0 a 12. El primer bigote se extiende de 0 a 4. La caja comienza en el primer cuartil, 4, y termina en el tercer cuartil, 9. Una línea discontinua vertical marca la mediana en 6. El segundo bigote se extiende desde el tercer cuartil hasta el valor más grande, 12. — Figura$\PageIndex{2}$

Utilice la siguiente información para responder a los siguientes tres ejercicios: Nos interesa el número de años que los alumnos de una clase particular de estadística primaria han vivido en California. La información en la siguiente tabla es de toda la sección.

Número de años	Frecuencia	Número de años	Frecuencia
			Total = 20
7	1	22	1
14	3	23	1
15	1	26	1
18	1	40	2
19	4	42	2
20	3

Ejercicio 2.6.13

¿Qué es el IQR?

Responder

Ejercicio 2.6.14

¿Cuál es el modo?

19
19.5
14 y 20
22.65

Ejercicio 2.6.15

¿Se trata de una muestra o de toda la población?

muestra
población entera
ni

Responder

Glosario

Tabla de frecuencias: una representación de datos en la que se muestran los datos agrupados junto con las frecuencias correspondientes
Media: un número que mide la tendencia central de los datos; un nombre común para la media es 'promedio'. El término 'media' es una forma abreviada de 'media aritmética'. Por definición, la media para una muestra (denotada por$\bar{x}$) es$\bar{x} = \dfrac{\text{Sum of all values in the sample}}{\text{Number of values in the sample}}$, y la media para una población (denotada por$\mu$) es$\mu = \dfrac{\text{Sum of all values in the population}}{\text{Number of values in the population}}$.
Mediana: un número que separa los datos ordenados en mitades; la mitad de los valores son el mismo número o menores que la mediana y la mitad de los valores son el mismo número o mayores que la mediana. La mediana puede o no ser parte de los datos.
Punto medio: la media de un intervalo en una tabla de frecuencias
Modo: el valor que aparece con mayor frecuencia en un conjunto de datos

# de películas	Frecuencia relativa
0	\(\dfrac{5}{30}\)
1	\(\dfrac{15}{30}\)
2	\(\dfrac{6}{30}\)
3	\(\dfrac{3}{30}\)
4	\(\dfrac{1}{30}\)