2.4: Medidas de la ubicación de los datos
- Page ID
- 153243
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)
( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\id}{\mathrm{id}}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\kernel}{\mathrm{null}\,}\)
\( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\)
\( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\)
\( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)
\( \newcommand{\vectorA}[1]{\vec{#1}} % arrow\)
\( \newcommand{\vectorAt}[1]{\vec{\text{#1}}} % arrow\)
\( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vectorC}[1]{\textbf{#1}} \)
\( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)
\( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)
\( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\(\newcommand{\avec}{\mathbf a}\) \(\newcommand{\bvec}{\mathbf b}\) \(\newcommand{\cvec}{\mathbf c}\) \(\newcommand{\dvec}{\mathbf d}\) \(\newcommand{\dtil}{\widetilde{\mathbf d}}\) \(\newcommand{\evec}{\mathbf e}\) \(\newcommand{\fvec}{\mathbf f}\) \(\newcommand{\nvec}{\mathbf n}\) \(\newcommand{\pvec}{\mathbf p}\) \(\newcommand{\qvec}{\mathbf q}\) \(\newcommand{\svec}{\mathbf s}\) \(\newcommand{\tvec}{\mathbf t}\) \(\newcommand{\uvec}{\mathbf u}\) \(\newcommand{\vvec}{\mathbf v}\) \(\newcommand{\wvec}{\mathbf w}\) \(\newcommand{\xvec}{\mathbf x}\) \(\newcommand{\yvec}{\mathbf y}\) \(\newcommand{\zvec}{\mathbf z}\) \(\newcommand{\rvec}{\mathbf r}\) \(\newcommand{\mvec}{\mathbf m}\) \(\newcommand{\zerovec}{\mathbf 0}\) \(\newcommand{\onevec}{\mathbf 1}\) \(\newcommand{\real}{\mathbb R}\) \(\newcommand{\twovec}[2]{\left[\begin{array}{r}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\ctwovec}[2]{\left[\begin{array}{c}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\threevec}[3]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\cthreevec}[3]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\fourvec}[4]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\cfourvec}[4]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\fivevec}[5]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\cfivevec}[5]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\mattwo}[4]{\left[\begin{array}{rr}#1 \amp #2 \\ #3 \amp #4 \\ \end{array}\right]}\) \(\newcommand{\laspan}[1]{\text{Span}\{#1\}}\) \(\newcommand{\bcal}{\cal B}\) \(\newcommand{\ccal}{\cal C}\) \(\newcommand{\scal}{\cal S}\) \(\newcommand{\wcal}{\cal W}\) \(\newcommand{\ecal}{\cal E}\) \(\newcommand{\coords}[2]{\left\{#1\right\}_{#2}}\) \(\newcommand{\gray}[1]{\color{gray}{#1}}\) \(\newcommand{\lgray}[1]{\color{lightgray}{#1}}\) \(\newcommand{\rank}{\operatorname{rank}}\) \(\newcommand{\row}{\text{Row}}\) \(\newcommand{\col}{\text{Col}}\) \(\renewcommand{\row}{\text{Row}}\) \(\newcommand{\nul}{\text{Nul}}\) \(\newcommand{\var}{\text{Var}}\) \(\newcommand{\corr}{\text{corr}}\) \(\newcommand{\len}[1]{\left|#1\right|}\) \(\newcommand{\bbar}{\overline{\bvec}}\) \(\newcommand{\bhat}{\widehat{\bvec}}\) \(\newcommand{\bperp}{\bvec^\perp}\) \(\newcommand{\xhat}{\widehat{\xvec}}\) \(\newcommand{\vhat}{\widehat{\vvec}}\) \(\newcommand{\uhat}{\widehat{\uvec}}\) \(\newcommand{\what}{\widehat{\wvec}}\) \(\newcommand{\Sighat}{\widehat{\Sigma}}\) \(\newcommand{\lt}{<}\) \(\newcommand{\gt}{>}\) \(\newcommand{\amp}{&}\) \(\definecolor{fillinmathshade}{gray}{0.9}\)Las medidas comunes de ubicación son cuartiles y percentiles. Los cuartiles son percentiles especiales. El primer cuartil, Q 1, es el mismo que el percentil 25, y el tercer cuartil, Q 3, es el mismo que el percentil 75. La mediana, M, se llama tanto el segundo cuartil como el percentil 50.
Para calcular cuartiles y percentiles, los datos deben ordenarse de menor a mayor. Los cuartiles dividen los datos ordenados en trimestres. Los percentiles dividen los datos ordenados en centésimas. Apuntar en el percentil 90 de un examen no significa, necesariamente, que recibiste el 90% en una prueba. Significa que el 90% de los puntajes de las pruebas son iguales o menores que su puntaje y el 10% de los puntajes de las pruebas son iguales o mayores que su puntaje de prueba.
Los percentiles son útiles para comparar valores. Por esta razón, las universidades y colegios utilizan ampliamente los percentiles. Una instancia en la que los colegios y universidades utilizan percentiles es cuando se utilizan los resultados del SAT para determinar una puntuación mínima de prueba que se utilizará como factor de aceptación. Por ejemplo, supongamos que Duke acepta puntajes SAT iguales o superiores al percentil 75. Eso se traduce en una puntuación de al menos 1220.
Los percentiles se utilizan principalmente con poblaciones muy grandes. Por lo tanto, si dijeras que el 90% de los puntajes de las pruebas son menores (y no iguales o menores) que tu puntaje, sería aceptable porque eliminar un valor de datos en particular no es significativo.
La mediana es un número que mide el “centro” de los datos. Se puede pensar en la mediana como el “valor medio”, pero en realidad no tiene que ser uno de los valores observados. Es un número que separa los datos ordenados en mitades. La mitad de los valores son el mismo número o menores que la mediana, y la mitad de los valores son el mismo número o mayores. Por ejemplo, considere los siguientes datos.
1; 11.5; 6; 7.2; 4; 8; 9; 10; 6.8; 8.3; 2; 2; 10; 1
Ordenado de menor a mayor:
1; 1; 2; 2; 4; 6; 6.8; 7.2; 8; 8.3; 9; 10; 10; 11.5
Dado que hay 14 observaciones, la mediana se encuentra entre el séptimo valor, 6.8, y el octavo valor, 7.2. Para encontrar la mediana, sumar los dos valores juntos y dividir por dos.
La mediana es de siete. La mitad de los valores son menores de siete y la mitad de los valores son mayores que siete.
Los cuartiles son números que separan los datos en cuartos. Los cuartiles pueden o no ser parte de los datos. Para encontrar los cuartiles, primero busque la mediana o el segundo cuartil. El primer cuartil, Q 1, es el valor medio de la mitad inferior de los datos, y el tercer cuartil, Q 3, es el valor medio, o mediana, de la mitad superior de los datos. Para hacerte la idea, considera el mismo conjunto de datos:
1; 1; 2; 2; 4; 6; 6.8; 7.2; 8; 8.3; 9; 10; 10; 11.5
La mediana o segundo cuartil es siete. La mitad inferior de los datos son 1, 1, 2, 2, 4, 6, 6.8. El valor medio de la mitad inferior es dos.
1; 1; 2; 2; 4; 6; 6.8
El número dos, que forma parte de los datos, es el primer cuartil. Una cuarta parte de los conjuntos completos de valores son iguales o menores que dos y tres cuartas partes de los valores son más de dos.
La mitad superior de los datos es 7.2, 8, 8.3, 9, 10, 10, 11.5. El valor medio de la mitad superior es nueve.
El tercer cuartil, Q 3, es nueve. Tres cuartas partes (75%) del conjunto de datos ordenados son menos de nueve. Un cuarto (25%) del conjunto de datos ordenados son mayores a nueve. El tercer cuartil es parte del conjunto de datos en este ejemplo.
El rango intercuartílico es un número que indica la propagación de la mitad media o el 50% medio de los datos. Es la diferencia entre el tercer cuartil (Q 3) y el primer cuartil (Q 1).
\[IQR = Q_3 – Q_1 \tag{2.4.1}\]
El IQR puede ayudar a determinar posibles valores atípicos. Se sospecha que un valor es un valor atípico potencial si es menor que (1.5) (IQR) por debajo del primer cuartil o más de (1.5) (IQR) por encima del tercer cuartil. Los valores atípicos potenciales siempre requieren más investigación.
Definición: Outliers
Un valor atípico potencial es un punto de datos que es significativamente diferente de los otros puntos de datos. Estos puntos de datos especiales pueden ser errores o algún tipo de anormalidad o pueden ser una clave para comprender los datos.
Ejemplo 2.4.1
Para los siguientes 13 precios inmobiliarios, calcule el IQR y determine si alguno de los precios son posibles valores atípicos. Los precios son en dólares.
389,950; 230,500; 158.000; 479.000; 639.000; 114,950; 5,500,000; 387.000; 659.000; 529,000; 575,000; 488,800; 1,095,000
Contestar
Ordene los datos de menor a mayor.
114,950; 158.000; 230,500; 387.000; 389,950; 479.000; 488,800; 529,000; 575,000; 639.000; 659.000; 1,095,000; 5,500,000
\[M = 488,800 \nonumber\]
\[Q_{1} = \dfrac{230,500 + 387,000}{2} = 308,750\nonumber\]
\[Q_{3} = \dfrac{639,000 + 659,000}{2} = 649,000\nonumber\]
\[IQR = 649,000 - 308,750 = 340,250\nonumber\]
\[(1.5)(IQR) = (1.5)(340,250) = 510,375\nonumber\]
\[Q_{1} - (1.5)(IQR) = 308,750 - 510,375 = –201,625\nonumber\]
\[Q_{3} + (1.5)(IQR) = 649,000 + 510,375 = 1,159,375\nonumber\]
Ningún precio de la casa es inferior a —201,625. No obstante, 5,500,000 es más de 1,159,375. Por lo tanto, 5,500,000 es un valor atípico potencial.
Ejercicio\(\PageIndex{1}\)
Para los siguientes 11 salarios, calcule el IQR y determine si algún salario es atípico. Los salarios son en dólares.
$33,000; $64.500; $28,000; $54.000; $72,000; $68.500; $69,000; $42,000; $54.000; $120,000; $40.500
Contestar
Ordene los datos de menor a mayor.
$28,000; $33,000; $40.500; $42,000; $54.000; $54.000; $64.500; $68.500; $69.000; $72,000; $120,000
Mediana = $54.000
\[Q_{1} = $40,500\nonumber\]
\[Q_{3} = $69,000\nonumber\]
\[IQR = $69,000 - $40,500 = $28,500\nonumber\]
\[(1.5)(IQR) = (1.5)($28,500) = $42,750\nonumber\]
\[Q_{1} - (1.5)(IQR) = $40,500 - $42,750 = -$2,250\nonumber\]
\[Q_{3} + (1.5)(IQR) = $69,000 + $42,750 = $111,750\nonumber\]
Ningún salario es inferior a —$2,250. Sin embargo, $120,000 es más de $11,750, por lo que $120,000 es un valor atípico potencial.
Ejemplo 2.4.2
Para los dos conjuntos de datos en el ejemplo de puntuaciones de las pruebas, encuentre lo siguiente:
- El rango intercuartílico. Compara los dos rangos intercuartílicos.
- Cualquier valor atípicos en cualquiera de los conjuntos.
Responder
El resumen de cinco números para las clases diurnas y nocturnas es
Mínimo | Q 1 | Mediana | Q 3 | Máximo | |
---|---|---|---|---|---|
Día | 32 | 56 | 74.5 | 82.5 | 99 |
Noche | 25.5 | 78 | 81 | 89 | 98 |
- El IQR para el grupo de día es\(Q_{3} - Q_{1} = 82.5 - 56 = 26.5\)
El IQR para el grupo nocturno es\(Q_{3} - Q_{1} = 89 - 78 = 11\)
El rango intercuartil (la dispersión o variabilidad) para la clase diurna es mayor que la clase nocturna IQR. Esto sugiere que se encontrarán más variaciones en los puntajes de las pruebas de clase diurna.
- Los valores atípicos de clase diurna se encuentran usando la regla IQR times 1.5. Entonces,
- \(Q_{1} - IQR(1.5) = 56 – 26.5(1.5) = 16.25\)
- \(Q_{3} + IQR(1.5) = 82.5 + 26.5(1.5) = 122.25\)
Dado que los valores mínimo y máximo para la clase de día son mayores a 16.25 y menores a 122.25, no hay valores atípicos.
Los valores atípicos de clase nocturna se calculan como:
- \(Q_{1} - IQR (1.5) = 78 – 11(1.5) = 61.5\)
- \(Q_{3} + IQR(1.5) = 89 + 11(1.5) = 105.5\)
Para esta clase, cualquier puntaje de prueba menor a 61.5 es un valor atípico. Por lo tanto, los puntajes de 45 y 25.5 son valores atípicos. Dado que ningún puntaje de prueba es mayor que 105.5, no hay valor atípico en el extremo superior.
Ejercicio\(\PageIndex{2}\)
Encuentre el rango intercuartílico para los dos conjuntos de datos siguientes y compárelos.
Puntajes de los exámenes para Clase A
69; 96; 81; 79; 65; 76; 83; 99; 89; 67; 90; 77; 85; 98; 66; 91; 77; 69; 80; 94
Puntajes de los exámenes para Clase B
90; 72; 80; 92; 90; 97; 92; 75; 79; 68; 70; 80; 99; 95; 78; 73; 71; 68; 95; 100
Responder
Clase A
Ordene los datos de menor a mayor.
65; 66; 67; 69; 69; 76; 77; 77; 79; 80; 81; 83; 85; 89; 90; 91; 94; 96; 98; 99
\(Median = \dfrac{80 + 81}{2}\)= 80.5
\(Q_{1} = \dfrac{69 + 76}{2} = 72.5\)
\(Q_{3} = \dfrac{90 + 91}{2} = 90.5\)
\(IQR = 90.5 - 72.5 = 18\)
Clase B
Ordene los datos de menor a mayor.
68; 68; 70; 71; 72; 73; 75; 78; 79; 80; 80; 90; 90; 92; 92; 95; 95; 97; 99; 100
\(Median = \dfrac{80 + 80}{2} = 80\)
\(Q_{1} = \dfrac{72 + 73}{2} = 72.5\)
\(Q_{3} = \dfrac{92 + 95}{2} = 93.5\)
\(IQR = 93.5 - 72.5 = 21\)
Los datos para la Clase B tienen un IQR mayor, por lo que los puntajes entre Q 3 y Q 1 (50% medio) para los datos de la Clase B están más dispersos y no agrupados alrededor de la mediana.
Ejemplo 2.4.3
A cincuenta estudiantes de estadística se les preguntó cuánto duermen por noche escolar (redondeado a la hora más cercana). Los resultados fueron:
CANTIDAD DE SUEÑO POR NOCHE ESCOLAR | FRECUENCIA | FRECUENCIA RELativa | Frecuencia relativa acumulativa |
---|---|---|---|
4 | 2 | 0.04 | 0.04 |
5 | 5 | 0.10 | 0.14 |
6 | 7 | 0.14 | 0.28 |
7 | 12 | 0.24 | 0.52 |
8 | 14 | 0.28 | 0.80 |
9 | 7 | 0.14 | 0.94 |
10 | 3 | 0.06 | 1.00 |
Encuentra el percentil 28. Observe el 0.28 en la columna “frecuencia relativa acumulativa”. Veintiocho por ciento de 50 valores de datos es 14 valores. Hay 14 valores menores que el percentil 28. Incluyen los dos 4s, los cinco 5s, y los siete 6s. El percentil 28 se encuentra entre los últimos seis y los primeros siete. El percentil 28 es 6.5.
Encuentra la mediana. Vuelva a mirar la columna “frecuencia relativa acumulativa” y encuentre 0.52. La mediana es el percentil 50 o el segundo cuartil. El 50% de 50 es 25. Hay 25 valores menores que la mediana. Incluyen los dos 4s, los cinco 5s, los siete 6s, y once de los 7s. La mediana o percentil 50 está entre los valores 25 o siete y 26 o siete. La mediana es siete.
Encuentra el tercer cuartil. El tercer cuartil es el mismo que el percentil 75. Puedes “globo ocular” esta respuesta. Si miras la columna “frecuencia relativa acumulativa”, encuentras 0.52 y 0.80. Cuando tienes todos los cuatro, cincos, seises y sietes, tienes 52% de los datos. Cuando incluyes todos los 8s, tienes el 80% de los datos. El percentil 75, entonces, debe ser un ocho. Otra forma de ver el problema es encontrar 75% de 50, que es 37.5, y redondear hasta 38. El tercer cuartil, Q 3, es el valor 38 th, que es un ocho. Puedes verificar esta respuesta contando los valores. (Hay 37 valores por debajo del tercer cuartil y 12 valores arriba).
Ejercicio\(\PageIndex{3}\)
A cuarenta choferes de autobús se les preguntó cuántas horas pasan cada día recorriendo sus rutas (redondeadas a la hora más cercana). Encuentra el percentil 65.
Cantidad de tiempo empleado en ruta (horas) | Frecuencia | Frecuencia relativa | Frecuencia Relativa Acumulada |
---|---|---|---|
2 | 12 | 0.30 | 0.30 |
3 | 14 | 0.35 | 0.65 |
4 | 10 | 0.25 | 0.90 |
5 | 4 | 0.10 | 1.00 |
Responder
El percentil 65 se encuentra entre los tres últimos y los cuatro primeros.
El percentil 65 es 3.5.
Ejemplo 2.4.4
Uso de la tabla:
- Encuentra el percentil 80.
- Encuentra el percentil 90.
- Encuentra el primer cuartil. ¿Cuál es otro nombre para el primer cuartil?
Solución
Usando los datos de la tabla de frecuencias, tenemos:
- El percentil 80 se encuentra entre los últimos ocho y los primeros nueve de la tabla (entre los valores 40 y 41 º). Por lo tanto, necesitamos tomar la media de los valores 40 th y 41 st. El percentil 80\(= \dfrac{8+9}{2} = 8.5\)
- El percentil 90 será el 45 º valor de datos (ubicación es\(0.90(50) = 45\)) y el 45 º valor de datos es nueve.
- Q 1 es también el percentil 25. El cálculo de la ubicación del percentil 25:\(P_{25} = 0.25(50) = 12.5 \approx 13\) el valor de datos número 13. Así, el percentil 25 es seis.
Ejercicio\(\PageIndex{4}\)
Refiérase a la Tabla. Encuentra el tercer cuartil. ¿Cuál es otro nombre para el tercer cuartil?
Responder
El tercer cuartil es el percentil 75, que es cuatro. El percentil 65 está entre tres y cuatro, y el percentil 90 está entre cuatro y 5.75. El tercer cuartil está entre 65 y 90, por lo que debe ser cuatro.
Estadísticas colaborativas
Tu instructor o un miembro de la clase preguntará a todos en clase cuántos suéteres poseen. Responde las siguientes preguntas:
- ¿Cuántos estudiantes fueron encuestados?
- ¿Qué tipo de muestreo hiciste?
- Construir dos histogramas diferentes. Para cada uno, valor inicial = _____ valor final = ____.
- Encuentra la mediana, el primer cuartil y el tercer cuartil.
- Construye una tabla de los datos para encontrar lo siguiente:
- el percentil 10
- el percentil 70
- el porcentaje de estudiantes que poseen menos de cuatro suéteres
Una fórmula para encontrar el percentil k th
Si tuvieras que investigar un poco, encontrarías varias fórmulas para calcular el percentil k. Aquí está uno de ellos.
- \(k =\)el percentil k. Puede o no ser parte de los datos.
- \(i =\)el índice (clasificación o posición de un valor de datos)
- \(n =\)el número total de datos
Ordene los datos de menor a mayor.
Calcular\(i = \dfrac{k}{100}(n + 1)\) i
Si\(i\) es un entero, entonces el\(k^{th}\) percentil es el valor de datos en la\(i^{th}\) posición en el conjunto ordenado de datos.
Si no\(i\) es un entero, entonces redondea hacia\(i\) arriba y redondea\(i\) hacia abajo a los enteros más cercanos. Promedio de los dos valores de datos en estas dos posiciones en el conjunto de datos ordenados. Esto es más fácil de entender en un ejemplo.
Ejemplo 2.4.5
Se listan 29 edades para los mejores actores ganadores del Oscar en orden desde el más pequeño hasta el más grande.
18; 21; 22; 25; 26; 27; 29; 30; 31; 33; 36; 37; 41; 42; 47; 52; 55; 57; 58; 62; 64; 67; 69; 71; 72; 73; 74; 76; 77- Encuentra el percentil 70.
- Encuentra el percentil 83.
Solución
-
- \(k = 70\)
- \(i\)= el índice
- \(n = 29\)
-
- \(k\)= 83 percentil
- \(i = the index\)
- \(n = 29\)
Ejercicio\(\PageIndex{5}\)
Se listan 29 edades para los mejores actores ganadores del Oscar en orden desde el más pequeño hasta el más grande.
18; 21; 22; 25; 26; 27; 29; 30; 31; 33; 36; 37; 41; 42; 47; 52; 55; 57; 58; 62; 64; 67; 69; 71; 72; 73; 74; 76; 77
Calcular el percentil 20 y el percentil 55.
Responder
\(k = 20\). Índice\(= i = \dfrac{k}{100}(n+1) = \dfrac{20}{100}(29 + 1) = 6\). La edad en la sexta posición es de 27 años. El percentil 20 es de 27 años.
\(k = 55\). Índice\(= i = \dfrac{k}{100}(n+1) = \dfrac{55}{100}(29 + 1) = 16.5\). Redondear hacia abajo a 16 y hasta 17. La edad en la posición 16 es 52 y la edad en la posición 17 es 55. El promedio de 52 y 55 es de 53.5. El percentil 55 es de 53.5 años.
Nota 2.4.2
Se pueden calcular percentiles usando calculadoras y computadoras. Hay una variedad de calculadoras en línea.
Una fórmula para encontrar el percentil de un valor en un conjunto de datos
- Ordene los datos de menor a mayor.
- \(x =\)el número de valores de datos contando desde la parte inferior de la lista de datos hasta pero sin incluir el valor de datos para el que desea encontrar el percentil.
- \(y =\)el número de valores de datos igual al valor de datos para el que desea encontrar el percentil.
- \(n =\)el número total de datos.
- Calcular\(\dfrac{x + 0.5y}{n}(100)\). Luego redondear al entero más cercano.
Ejemplo 2.4.6
Se listan 29 edades para los mejores actores ganadores del Oscar en orden desde el más pequeño hasta el más grande.
18; 21; 22; 25; 26; 27; 29; 30; 31; 33; 36; 37; 41; 42; 47; 52; 55; 57; 58; 62; 64; 67; 69; 71; 72; 73; 74; 76; 77- Encuentra el percentil para 58.
- Encuentra el percentil para 25.
Solución
- Contando desde la parte inferior de la lista, hay 18 valores de datos menores a 58. Hay un valor de 58.
\(x = 18\)y\(y = 1\). \(\dfrac{x + 0.5y}{n}(100) = \dfrac{18 + 0.5(1)}{29}(100) = 63.80\). 58 es el percentil 64.
- Contando desde la parte inferior de la lista, hay tres valores de datos menores a 25. Hay un valor de 25.
\(x = 3\)y\(y = 1\). \(\dfrac{x + 0.5y}{n}(100) = \dfrac{3 + 0.5(1)}{29}(100) = 12.07\). Veinticinco es el percentil 12.
Ejercicio\(\PageIndex{6}\)
Se listan 30 edades para los mejores actores ganadores del Oscar en orden desde el más pequeño hasta el más grande.
18; 21; 22; 25; 26; 27; 29; 30; 31; 33; 36; 37; 41; 42; 47; 52; 55; 57; 58; 62; 64; 67; 69; 71; 72; 73; 74; 76; 77
Encuentra los percentiles para 47 y 31.
Responder
Percentil para 47: Contando desde la parte inferior de la lista, hay 15 valores de datos menores que 47. Hay un valor de 47.
\(x = 15\)y\(y = 1\). \(\dfrac{x + 0.5y}{n}(100) = \dfrac{15 + 0.5(1)}{30}(100) = 51.67\). 47 es el percentil 52.
Percentil para 31: Contando desde la parte inferior de la lista, hay ocho valores de datos menores a 31. Hay dos valores de 31.
\(x = 8\)y\(y = 2\). \(\dfrac{x + 0.5y}{n}(100) = \dfrac{8 + 0.5(2)}{30}(100) = 30\). 31 es el percentil 30.
Interpretación de percentiles, cuartiles y mediana
Un percentil indica la posición relativa de un valor de datos cuando los datos se clasifican en orden numérico de menor a mayor. Los porcentajes de los valores de los datos son menores o iguales al percentil p th. Por ejemplo, el 15% de los valores de datos son menores o iguales al percentil 15.
- Los percentiles bajos siempre corresponden a valores de datos más bajos.
- Los percentiles altos siempre corresponden a valores de datos más altos.
Un percentil puede corresponder o no a un juicio de valor sobre si es “bueno” o “malo”. La interpretación de si un determinado percentil es “bueno” o “malo” depende del contexto de la situación a la que se apliquen los datos. En algunas situaciones, un percentil bajo se consideraría “bueno”; en otros contextos un percentil alto podría considerarse “bueno”. En muchas situaciones, no hay juicio de valor que aplique.
Comprender cómo interpretar correctamente los percentiles es importante no sólo a la hora de describir los datos, sino también a la hora de calcular las probabilidades en capítulos posteriores de este texto.
DIRECTRIZ
Al redactar la interpretación de un percentil en el contexto de los datos dados, la oración deberá contener la siguiente información.
- información sobre el contexto de la situación que se está considerando
- el valor de datos (valor de la variable) que representa el percentil
- el porcentaje de individuos o ítems con valores de datos por debajo del percentil
- el porcentaje de individuos o ítems con valores de datos por encima del percentil.
Ejemplo 2.4.7
En una prueba de matemáticas cronometrada, el primer cuartil por el tiempo que tardó en terminar el examen fue de 35 minutos. Interpretar el primer cuartil en el contexto de esta situación.
Responder
- El veinticinco por ciento de los alumnos terminó el examen en 35 minutos o menos.
- El setenta y cinco por ciento de los estudiantes terminaron el examen en 35 minutos o más.
- Un percentil bajo podría considerarse bueno, ya que es deseable terminar más rápidamente en un examen cronometrado. (Si tardas demasiado, es posible que no puedas terminar).
Ejercicio\(\PageIndex{7}\)
Para el guión de 100 metros, el tercer cuartil por tiempos para terminar la carrera fue de 11.5 segundos. Interpretar el tercer cuartil en el contexto de la situación.
Responder
El veinticinco por ciento de los corredores terminaron la carrera en 11.5 segundos o más. El setenta y cinco por ciento de los corredores terminaron la carrera en 11.5 segundos o menos. Un percentil más bajo es bueno porque es deseable terminar una carrera más rápido.
Ejemplo 2.4.8
En una prueba matemática de 20 preguntas, el percentil 70 para el número de respuestas correctas fue de 16. Interpretar el percentil 70 en el contexto de esta situación.
Responder
- El setenta por ciento de los alumnos contestó correctamente 16 o menos preguntas.
- El treinta por ciento de los alumnos contestó correctamente 16 o más preguntas.
- Un percentil superior podría considerarse bueno, ya que es deseable responder más preguntas correctamente.
Ejercicio\(\PageIndex{8}\)
En una asignación escrita de 60 puntos, el percentil 80 para el número de puntos ganados fue 49. Interpretar el percentil 80 en el contexto de esta situación.
Responder
El ochenta por ciento de los estudiantes obtuvo 49 puntos o menos. El veinte por ciento de los estudiantes obtuvo 49 puntos o más. Un percentil más alto es bueno porque es deseable obtener más puntos en una asignación.
Ejemplo 2.4.9
En un colegio comunitario, se encontró que el percentil 30 de unidades de crédito en las que están matriculados los estudiantes es de siete unidades. Interpretar el percentil 30 en el contexto de esta situación.
Responder
- El treinta por ciento de los estudiantes están matriculados en siete o menos unidades de crédito.
- El setenta por ciento de los estudiantes están matriculados en siete o más unidades de crédito.
- En este ejemplo, no hay juicio de valor “bueno” o “malo” asociado a un percentil superior o inferior. Los estudiantes asisten a un colegio comunitario por diversas razones y necesidades, y su carga de cursos varía según sus necesidades.
Ejercicio\(\PageIndex{9}\)
Durante una temporada, el percentil 40 por puntos anotados por jugador en un juego es de ocho. Interpretar el percentil 40 en el contexto de esta situación.
Responder
El cuarenta por ciento de los jugadores anotó ocho puntos o menos. El sesenta por ciento de los jugadores anotó ocho puntos o más. Un percentil más alto es bueno porque es deseable conseguir más puntos en un juego de basquetbol.
Ejemplo 2.4.10
Sharpe Middle School está solicitando una beca que se utilizará para agregar equipo de fitness al gimnasio. El director encuestó a 15 estudiantes anónimos para determinar cuántos minutos diarios pasan los estudiantes haciendo ejercicio. Se muestran los resultados de los 15 estudiantes anónimos.
0 minutos; 40 minutos; 60 minutos; 30 minutos; 60 minutos
10 minutos; 45 minutos; 30 minutos; 300 minutos; 90 minutos;
30 minutos; 120 minutos; 60 minutos; 0 minutos; 20 minutos
Determinar los siguientes cinco valores.
- Mín = 0
- Q 1 = 20
- Med = 40
- Q 3 = 60
- Máx = 300
Si fueras el director, ¿estarías justificado en la compra de nuevos equipos de fitness? Dado que el 75% de los alumnos hacen ejercicio durante 60 minutos o menos diarios, y dado que el IQR es de 40 minutos (60 — 20 = 40), sabemos que la mitad de los estudiantes encuestados hacen ejercicio entre 20 minutos y 60 minutos diarios. Esto parece una cantidad razonable de tiempo dedicado al ejercicio, por lo que el principal estaría justificado en la compra del nuevo equipo.
No obstante, el director debe tener cuidado. El valor 300 parece ser un valor atípico potencial.
\[Q_{3} + 1.5(IQR) = 60 + (1.5)(40) = 120\].
El valor 300 es mayor que 120 por lo que es un valor atípico potencial. Si lo eliminamos y calculamos los cinco valores, obtenemos los siguientes valores:
- Mín = 0
- Q 1 = 20
- Q 3 = 60
- Máx = 120
Todavía tenemos al 75% de los estudiantes haciendo ejercicio durante 60 minutos o menos diarios y la mitad de los estudiantes haciendo ejercicio entre 20 y 60 minutos diarios. Sin embargo, 15 estudiantes es una muestra pequeña y el director debe encuestar a más estudiantes para estar seguro de los resultados de su encuesta.
Referencias
- Cauchon, Dennis, Paul Overberg. “Los datos del censo muestran que las minorías ahora son la mayoría de los nacimientos estadounidenses”. USA Today, 2012. Disponible en línea en usatoday30.usatoday.com/news/... sus/55029100/1 (consultado el 3 de abril de 2013).
- Datos del Departamento de Comercio de Estados Unidos: Oficina del Censo de Estados Unidos. Disponible en línea en http://www.census.gov/ (consultado el 3 de abril de 2013).
- “Censo de 1990”. Departamento de Comercio de Estados Unidos: Oficina del Censo de Estados Unidos. Disponible en línea en http://www.census.gov/main/www/cen1990.html (consultado el 3 de abril de 2013).
- Datos de San Jose Mercury News.
- Datos de la revista Time; encuesta de Yankelovich Partners, Inc.
Revisar
Los valores que dividen un conjunto de datos ordenados por rango en 100 partes iguales se denominan percentiles. Se utilizan percentiles para comparar e interpretar datos. Por ejemplo, una observación al percentil 50 sería mayor al 50 por ciento de las otras obeservaciones del conjunto. Los cuartiles dividen los datos en trimestres. El primer cuartil (Q 1) es el percentil 25, el segundo cuartil (Q 2 o mediana) es el percentil 50 y el tercer cuartil (Q 3) es el percentil 75. El rango intercuartil, o IQR, es el rango del 50 por ciento medio de los valores de datos. El IQR se encuentra restando Q 1 de Q 3, y puede ayudar a determinar valores atípicos mediante el uso de las siguientes dos expresiones.
- \(Q_{3} + IQR(1.5)\)
- \(Q_{1} - IQR(1.5)\)
Revisión de Fórmula
\[i = \dfrac{k}{100}(n+1) \nonumber\]
donde\(i\) = la clasificación o posición de un valor de datos,
- \(k\)= el percentil k th,
- \(n\)= número total de datos.
Expresión para encontrar el percentil de un valor de datos:\(\left(\dfrac{x + 0.5y}{n}\right)(100)\)
donde\(x =\) el número de valores contando desde la parte inferior de la lista de datos hasta pero sin incluir el valor de datos para el que desea encontrar el percentil,
\(y =\)el número de valores de datos igual al valor de datos para el que desea encontrar el percentil,
\(n =\)número total de datos
Glosario
- Gama Intercuartil
- o IQR, es el rango del 50 por ciento medio de los valores de los datos; el IQR se encuentra restando el primer cuartil del tercer cuartil.
- Valor atípico
- una observación que no se ajusta al resto de los datos
- Percentil
- un número que divide los datos ordenados en centésimas; los percentiles pueden o no ser parte de los datos. La mediana de los datos es el segundo cuartil y el percentil 50. El primer y tercer cuartiles son los percentiles 25 y 75, respectivamente.
- Cuartiles
- los números que separan los datos en cuartos; los cuartiles pueden o no ser parte de los datos. El segundo cuartil es la mediana de los datos.