Saltar al contenido principal
LibreTexts Español

2.2: Medidas de la Ubicación de los Datos

  • Page ID
    150863
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Las medidas comunes de ubicación son cuartiles y percentiles

    Los cuartiles son percentiles especiales. El primer cuartil,\(Q_1\), es lo mismo que el\(25^{th}\) percentil, y el tercer cuartil,\(Q_3\), es lo mismo que el\(75^{th}\) percentil. La mediana, M, se llama tanto el segundo cuartil como el percentil 50.

    Para calcular cuartiles y percentiles, los datos deben ordenarse de menor a mayor. Los cuartiles dividen los datos ordenados en trimestres. Los percentiles dividen los datos ordenados en centésimas. Apuntar en el\(90^{th}\) percentil de un examen no significa, necesariamente, que recibiste el 90% en una prueba. Significa que el 90% de los puntajes de las pruebas son iguales o menores que su puntaje y el 10% de los puntajes de las pruebas son iguales o mayores que su puntaje de prueba.

    Los percentiles son útiles para comparar valores. Por esta razón, las universidades y colegios utilizan ampliamente los percentiles. Una instancia en la que los colegios y universidades utilizan percentiles es cuando se utilizan los resultados del SAT para determinar una puntuación mínima de prueba que se utilizará como factor de aceptación. Por ejemplo, supongamos que Duke acepta puntajes SAT iguales o superiores al\(75^{th}\) percentil. Eso se traduce en una puntuación de al menos 1220.

    Los percentiles se utilizan principalmente con poblaciones muy grandes. Por lo tanto, si dijeras que el 90% de los puntajes de las pruebas son menores (y no iguales o menores) que tu puntaje, sería aceptable porque eliminar un valor de datos en particular no es significativo.

    La mediana es un número que mide el “centro” de los datos. Se puede pensar en la mediana como el “valor medio”, pero en realidad no tiene que ser uno de los valores observados. Es un número que separa los datos ordenados en mitades. La mitad de los valores son el mismo número o menores que la mediana, y la mitad de los valores son el mismo número o mayores. Por ejemplo, considere los siguientes datos.
    \(1; 11.5; 6; 7.2; 4; 8; 9; 10; 6.8; 8.3; 2; 2; 10; 1\)
    Ordenado de menor a mayor:
    \(1; 1; 2; 2; 4; 6; 6.8; 7.2; 8; 8.3; 9; 10; 10; 11.5\)

    Dado que hay 14 observaciones, la mediana se encuentra entre el séptimo valor, 6.8, y el octavo valor, 7.2. Para encontrar la mediana, sumar los dos valores juntos y dividir por dos.

    \[\frac{6.8+7.2}{2}=7\nonumber\]

    La mediana es de siete. La mitad de los valores son menores de siete y la mitad de los valores son mayores que siete.

    Los cuartiles son números que separan los datos en cuartos. Los cuartiles pueden o no ser parte de los datos. Para encontrar los cuartiles, primero busque la mediana o el segundo cuartil. El primer cuartil,\(Q_1\), es el valor medio de la mitad inferior de los datos, y el tercer cuartil,\(Q_3\), es el valor medio, o mediana, de la mitad superior de los datos. Para hacerte la idea, considera el mismo conjunto de datos:
    1; 1; 2; 2; 4; 6; 6.8; 7.2; 8; 8.3; 9; 10; 10; 11.5

    La mediana o segundo cuartil es siete. La mitad inferior de los datos son 1, 1, 2, 2, 4, 6, 6.8. El valor medio de la mitad inferior es dos.
    1; 1; 2; 2; 4; 6; 6.8

    El número dos, que forma parte de los datos, es el primer cuartil. Una cuarta parte de los conjuntos completos de valores son iguales o menores que dos y tres cuartas partes de los valores son más de dos.

    La mitad superior de los datos es 7.2, 8, 8.3, 9, 10, 10, 11.5. El valor medio de la mitad superior es nueve.

    El tercer cuartil,\(Q_3\), es nueve. Tres cuartas partes (75%) del conjunto de datos ordenados son menos de nueve. Un cuarto (25%) del conjunto de datos ordenados son mayores a nueve. El tercer cuartil es parte del conjunto de datos en este ejemplo.

    El rango intercuartílico es un número que indica la propagación de la mitad media o el 50% medio de los datos. Es la diferencia entre el tercer cuartil (\(Q_3\)) y el primer cuartil (\(Q_1\)).

    \(IQR = Q_3 – Q_1\)

    El\(IQR\) puede ayudar a determinar posibles valores atípicos. Se sospecha que un valor es un valor atípico potencial si es menor que\(\bf{(1.5)(IQR)\) por debajo del primer cuartil o más que\(\bf{(1.5)(IQR)}\) por encima del tercer cuartil. Los valores atípicos potenciales siempre requieren más investigación.

    valor atípico potencial

    Un valor atípico potencial es un punto de datos que es significativamente diferente de los otros puntos de datos. Estos puntos de datos especiales pueden ser errores o algún tipo de anormalidad o pueden ser una clave para comprender los datos.

    Ejemplo\(\PageIndex{14}\)

    Para los siguientes 13 precios inmobiliarios, calcule los\(IQR\) y determine si alguno de los precios son posibles valores atípicos. Los precios son en dólares.
    \(389,950; 230,500; 158,000; 479,000; 639,000; 114,950; 5,500,000; 387,000; 659,000; 529,000; 575,000; 488,800; 1,095,000\)

    Responder

    Solución 2.14

    Ordene los datos de menor a mayor.

    \(114,950; 158,000; 230,500; 387,000; 389,950; 479,000; 488,800; 529,000; 575,000; 639,000; 659,000; 1,095,000; 5,500,000\)

    \(M = 488,800\)

    \(Q_{1}=\frac{230,500+387,000}{2}=308,750\)

    \(Q_{3}=\frac{639,000+659,000}{2}=649,000\)

    \(IQR = 649,000 – 308,750 = 340,250\)

    \((1.5)(IQR) = (1.5)(340,250) = 510,375\)

    \(Q_1 – (1.5)(IQR) = 308,750 – 510,375 = –201,625\)

    \(Q_3 + (1.5)(IQR) = 649,000 + 510,375 = 1,159,375\)

    No hay precio de la casa es menor que\(–201,625\). No obstante,\(5,500,000\) es más que\(1,159,375\). Por lo tanto,\(5,500,000\) es un potencial atípico.

    Ejemplo\(\PageIndex{15}\)

    Para los dos conjuntos de datos en el ejemplo de puntuaciones de las pruebas, encuentre lo siguiente:

    1. El rango intercuartílico. Compara los dos rangos intercuartílicos.
    2. Cualquier valor atípico en cualquiera de los conjuntos.
    Responder

    Solución 2.15

    El resumen de cinco números para las clases diurnas y nocturnas es

    \ (\ PageIndex {21}\) “>
    Mínimo \(Q_1\) Mediana \(Q_3\) Máximo
    Día 32 \ (Q_1\)” class="lt-estados-4548">56 74.5 \ (Q_3\)” class="lt-estados-4548">82.5 99
    Noche 25.5 \ (Q_1\)” class="lt-stats-4548">78 81 \ (Q_3\)” class="lt-estados-4548">89 98
    Mesa\(\PageIndex{21}\)

    a. El grupo\(IQR\) para el día es\(Q_3 – Q_1 = 82.5 – 56 = 26.5\)

    El\(IQR\) para el grupo nocturno es\(Q_3 – Q_1 = 89 – 78 = 11\)

    El rango intercuartílico (la dispersión o variabilidad) para la clase diurna es mayor que la clase nocturna\(IQR\). Esto sugiere que se encontrarán más variaciones en los puntajes de las pruebas de clase diurna.

    b. Los valores atípicos de clase diurna se encuentran usando la regla\(IQR\) times 1.5. Entonces,
    • \(Q_1 - IQR(1.5) = 56 – 26.5(1.5) = 16.25\)
    • \(Q_3 + IQR(1.5) = 82.5 + 26.5(1.5) = 122.25\)

    Dado que los valores mínimo y máximo para la clase de día son mayores que\(16.25\) y menores que\(122.25\), no hay valores atípicos.

    Los valores atípicos de clase nocturna se calculan como:

    • \(Q_1 – IQR (1.5) = 78 – 11(1.5) = 61.5\)
    • \(Q_3 + IQR(1.5) = 89 + 11(1.5) = 105.5\)

    Para esta clase, cualquier puntaje de prueba menor que\(61.5\) es un valor atípico. Por lo tanto, las puntuaciones de\(45\) y\(25.5\) son valores atípicos. Dado que ningún puntaje de prueba es mayor que 105.5, no hay valor atípico en el extremo superior.

    Ejemplo\(\PageIndex{16}\)

    A cincuenta estudiantes de estadística se les preguntó cuánto duermen por noche escolar (redondeado a la hora más cercana). Los resultados fueron:

    \ (\ PageIndex {22}\) “>
    Cantidad de sueño por noche escolar (horas) Frecuencia Frecuencia relativa Frecuencia relativa acumulativa
    4 2 0.04 0.04
    5 5 0.10 0.14
    6 7 0.14 0.28
    7 12 0.24 0.52
    8 14 0.28 0.80
    9 7 0.14 0.94
    10 3 0.06 1.00
    Mesa\(\PageIndex{22}\)

    Encuentra el percentil 28. Observe el 0.28 en la columna “frecuencia relativa acumulativa”. Veintiocho por ciento de 50 valores de datos es 14 valores. Hay 14 valores menores que el percentil 28. Incluyen los dos 4s, los cinco 5s, y los siete 6s. El percentil 28 se encuentra entre los últimos seis y los primeros siete. El percentil 28 es 6.5.

    Encuentra la mediana. Vuelva a mirar la columna “frecuencia relativa acumulativa” y encuentre 0.52. La mediana es el percentil 50 o el segundo cuartil. El 50% de 50 es 25. Hay 25 valores menores que la mediana. Incluyen los dos 4s, los cinco 5s, los siete 6s, y once de los 7s. La mediana o percentil 50 está entre los valores 25 o siete y 26 o siete. La mediana es de siete.

    Encuentra el tercer cuartil. El tercer cuartil es lo mismo que el\(75^{th}\) percentil. Puedes “globo ocular” esta respuesta. Si miras la columna “frecuencia relativa acumulativa”, encuentras 0.52 y 0.80. Cuando tienes todos los cuatro, cinco, seises y sietes, tienes 52% de los datos. Cuando incluyes todos los 8s, tienes el 80% de los datos. El\(bf{75^{th}}\) percentil, entonces, debe ser un ocho. Otra forma de ver el problema es encontrar 75% de 50, que es 37.5, y redondear hasta 38. El tercer cuartil,\(Q_3\), es el valor 38 th, que es un ocho. Puedes verificar esta respuesta contando los valores. (Hay 37 valores por debajo del tercer cuartil y 12 valores arriba).

    Ejercicio\(\PageIndex{16}\)

    A cuarenta choferes de autobús se les preguntó cuántas horas pasan cada día recorriendo sus rutas (redondeadas a la hora más cercana). Encuentra el percentil 65.

    \ (\ PageIndex {23}\) “>
    Cantidad de tiempo empleado en ruta (horas) Frecuencia Frecuencia relativa Frecuencia relativa acumulativa
    2 12 0.30 0.30
    3 14 0.35 0.65
    4 10 0.25 0.90
    5 4 0.10 1.00
    Mesa\(\PageIndex{23}\)

    Ejemplo\(\PageIndex{17}\)

    Uso de la tabla\(\PageIndex{22}\):

    1. Encuentra el\(80^{th}\) percentil.
    2. Encuentra el\(90^{th}\) percentil.
    3. Encuentra el primer cuartil. ¿Cuál es otro nombre para el primer cuartil?
    Responder

    Solución 2.17

    Usando los datos de la tabla de frecuencias, tenemos:

    a. El\(80^{th}\) percentil se encuentra entre los últimos ocho y los primeros nueve de la tabla (entre los\(41^{st}\) valores\(40^{th}\) y). Por lo tanto, necesitamos tomar la media de los\(40^{th}\)\(41^{st}\) valores a. El\(80^{th}\) percentil\(=\frac{8+9}{2}=8.5\)

    b. El\(90^{th}\) percentil será el valor de\(45^{th}\) datos (ubicación es\(0.90(50) = 45\)) y el valor de datos 45 es nueve.

    c.\(Q_1\) es también el percentil 25. El cálculo de la ubicación del\(25^{th}\) percentil:\(P_{25}=0.25(50)=12.5 \approx 13\) el valor\(13^{th}\) de los datos. Así, el\(25^{th}\) percentil es seis.

    Una fórmula para encontrar el\(k\) percentil th

    Si tuvieras que investigar un poco, encontrarías varias fórmulas para calcular el\(k^{th}\) percentil. Aquí está uno de ellos.

    \(k =\)el\(k^{th}\) percentil. Puede o no ser parte de los datos.

    \(i =\)el índice (clasificación o posición de un valor de datos)

    \(n =\)el número total de puntos de datos, u observaciones

    • Ordene los datos de menor a mayor.
    • Calcular\(i=\frac{k}{100}(n+1)\)
    • Si i es un entero, entonces el\(k^{th}\) percentil es el valor de datos en la\(i^{th}\) posición en el conjunto ordenado de datos.
    • Si i no es un entero, entonces redondear i hacia arriba y redondear i hacia abajo a los enteros más cercanos. Promedio de los dos valores de datos en estas dos posiciones en el conjunto de datos ordenados. Esto es más fácil de entender en un ejemplo.

    Ejemplo\(\PageIndex{18}\)

    Se listan 29 edades para los mejores actores ganadores del Oscar en orden desde el más pequeño hasta el más grande.
    \(18; 21; 22; 25; 26; 27; 29; 30; 31; 33; 36; 37; 41; 42; 47; 52; 55; 57; 58; 62; 64; 67; 69; 71; 72; 73; 74; 76; 77\)

    1. Encuentra el\(70^{th}\) percentil.
    2. Encuentra el\(83^{rd}\) percentil.
    Responder

    Solución 2.18

    1.

    • \(k = 70\)
    • \(i\)= el índice
    • \(n = 29\)
    \(i=\frac{k}{100}(n+1)=\left(\frac{70}{100}\right)(29+1)=21\). Veintiuno es un entero, y el valor de datos en la posición 21 en el conjunto de datos ordenado es 64. El percentil 70 es de 64 años.

    2.

    • \(k = 83^{rd}\)percentil
    • \(i\)= el índice
    • \(n = 29\)
    \(i=\frac{k}{100}(n+1)=( \frac{83}{100} )(29+1)=24.9\), que NO es un número entero. Redondearlo hasta 24 y hasta 25. La edad en la\(24^{th}\) posición es 71 y la edad en la\(25^{th}\) posición es 72. Promedio 71 y 72. El\(83^{rd}\) percentil es de 71.5 años.

    Ejercicio\(\PageIndex{18}\)

    Se listan 29 edades para los mejores actores ganadores del Oscar en orden desde el más pequeño hasta el más grande.

    \(18; 21; 22; 25; 26; 27; 29; 30; 31; 33; 36; 37; 41; 42; 47; 52; 55; 57; 58; 62; 64; 67; 69; 71; 72; 73; 74; 76; 77\)
    Calcular el percentil 20 y el percentil 55.

    Una fórmula para encontrar el percentil de un valor en un conjunto de datos

    • Ordene los datos de menor a mayor.
    • \(x\)= el número de valores de datos contando desde la parte inferior de la lista de datos hasta pero sin incluir el valor de datos para el que desea encontrar el percentil.
    • \(y\)= el número de valores de datos igual al valor de datos para el que desea encontrar el percentil.
    • \(n\)= el número total de datos.
    • Calcular\(\frac{x+0.5 y}{n}(100)\). Luego redondear al entero más cercano.

    Ejemplo\(\PageIndex{19}\)

    Se listan 29 edades para los mejores actores ganadores del Oscar en orden desde el más pequeño hasta el más grande.
    \(18; 21; 22; 25; 26; 27; 29; 30; 31; 33; 36; 37; 41; 42; 47; 52; 55; 57; 58; 62; 64; 67; 69; 71; 72; 73; 74; 76; 77\)

    1. Encuentra el percentil para 58.
    2. Encuentra el percentil para 25.
    Responder

    Solución 2.19

    1. Contando desde la parte inferior de la lista, hay 18 valores de datos menores a 58. Hay un valor de 58.

    \(x = 18\)y\(y=1 . \frac{x+0.5 y}{n}(100)=\frac{18+0.5(1)}{29}(100)=63.80\). 58 es el\(64^{th}\) percentil.

    2. Contando desde la parte inferior de la lista, hay tres valores de datos menores a 25. Hay un valor de 25.

    \(x = 3\)y\(y=1 . \frac{x+0.5 y}{n}(100)=\frac{3+0.5(1)}{29}(100)=12.07\). Veinticinco es el\(12^{th}\) percentil.

    Interpretación de percentiles, cuartiles y mediana

    Un percentil indica la posición relativa de un valor de datos cuando los datos se clasifican en orden numérico de menor a mayor. Los porcentajes de los valores de los datos son menores o iguales al percentil pth. Por ejemplo, el 15% de los valores de datos son menores o iguales al percentil 15.

    • Los percentiles bajos siempre corresponden a valores de datos más bajos.
    • Los percentiles altos siempre corresponden a valores de datos más altos.

    Un percentil puede corresponder o no a un juicio de valor sobre si es “bueno” o “malo”. La interpretación de si un determinado percentil es “bueno” o “malo” depende del contexto de la situación a la que se aplican los datos. En algunas situaciones, un percentil bajo se consideraría “bueno”; en otros contextos un percentil alto podría considerarse “bueno”. En muchas situaciones, no hay juicio de valor que aplique.

    Comprender cómo interpretar correctamente los percentiles es importante no sólo a la hora de describir los datos, sino también a la hora de calcular las probabilidades en capítulos posteriores de este texto.

    NOTA

    Al redactar la interpretación de un percentil en el contexto de los datos dados, la oración deberá contener la siguiente información.

    • información sobre el contexto de la situación que se está considerando
    • el valor de datos (valor de la variable) que representa el percentil
    • el porcentaje de individuos o ítems con valores de datos por debajo del percentil
    • el porcentaje de individuos o ítems con valores de datos por encima del percentil.

    Ejemplo\(\PageIndex{20}\)

    En una prueba de matemáticas cronometrada, el primer cuartil por el tiempo que tardó en terminar el examen fue de 35 minutos. Interpretar el primer cuartil en el contexto de esta situación.

    Responder

    Solución 2.20

    El veinticinco por ciento de los alumnos terminó el examen en 35 minutos o menos. El setenta y cinco por ciento de los estudiantes terminaron el examen en 35 minutos o más. Un percentil bajo podría considerarse bueno, ya que es deseable terminar más rápidamente en un examen cronometrado. (Si tardas demasiado, es posible que no puedas terminar).

    Ejemplo\(\PageIndex{21}\)

    En una prueba matemática de 20 preguntas, el percentil 70 para el número de respuestas correctas fue 16. Interpretar el percentil 70 en el contexto de esta situación.

    Responder

    Solución 2.21

    El setenta por ciento de los alumnos contestó correctamente 16 o menos preguntas. El treinta por ciento de los alumnos contestó correctamente 16 o más preguntas. Un percentil superior podría considerarse bueno, ya que es deseable responder más preguntas correctamente.

    Ejercicio\(\PageIndex{21}\)

    En una asignación escrita de 60 puntos, el\(80^{th}\) percentil para el número de puntos ganados fue 49. Interpretar el\(80^{th}\) percentil en el contexto de esta situación.

    Ejemplo\(\PageIndex{22}\)

    En un colegio comunitario, se encontró que el\(30^{th}\) percentil de unidades de crédito a las que están matriculados los estudiantes es de siete unidades. Interpretar el\(30^{th}\) percentil en el contexto de esta situación.

    Responder

    Solución 2.22

    • El treinta por ciento de los estudiantes están matriculados en siete o menos unidades de crédito.
    • El setenta por ciento de los estudiantes están matriculados en siete o más unidades de crédito.
    • En este ejemplo, no hay juicio de valor “bueno” o “malo” asociado a un percentil superior o inferior. Los estudiantes asisten a un colegio comunitario por diversas razones y necesidades, y su carga de cursos varía según sus necesidades.

    Ejemplo\(\PageIndex{23}\)

    Sharpe Middle School está solicitando una beca que se utilizará para agregar equipo de fitness al gimnasio. El director encuestó a 15 estudiantes anónimos para determinar cuántos minutos diarios pasan los estudiantes haciendo ejercicio. Se muestran los resultados de los 15 estudiantes anónimos.

    0 minutos; 40 minutos; 60 minutos; 30 minutos; 60 minutos

    10 minutos; 45 minutos; 30 minutos; 300 minutos; 90 minutos;

    30 minutos; 120 minutos; 60 minutos; 0 minutos; 20 minutos

    Determinar los siguientes cinco valores.

    • Mín = 0
    • \(Q_1 = 20\)
    • Med = 40
    • \(Q_3 = 60\)
    • Máx = 300

    Si fueras el director, ¿estarías justificado en la compra de nuevos equipos de fitness? Ya que el 75% de los alumnos hacen ejercicio durante 60 minutos o menos diarios, y como el\(IQR\) es de 40 minutos\((60 – 20 = 40)\), sabemos que la mitad de los alumnos encuestados hacen ejercicio entre 20 minutos y 60 minutos diarios. Esto parece una cantidad razonable de tiempo dedicado al ejercicio, por lo que el principal estaría justificado en la compra del nuevo equipo.

    No obstante, el director debe tener cuidado. El valor 300 parece ser un valor atípico potencial.

    \(Q_3 + 1.5(IQR) = 60 + (1.5)(40) = 120\).

    El valor 300 es mayor que 120 por lo que es un valor atípico potencial. Si lo eliminamos y calculamos los cinco valores, obtenemos los siguientes valores:

    • Mín = 0
    • \(Q_1 = 20\)
    • \(Q_3 = 60\)
    • Máx = 120

    Todavía tenemos al 75% de los estudiantes haciendo ejercicio durante 60 minutos o menos diarios y la mitad de los estudiantes haciendo ejercicio entre 20 y 60


    This page titled 2.2: Medidas de la Ubicación de los Datos is shared under a CC BY 4.0 license and was authored, remixed, and/or curated by OpenStax via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.