3.3: Ranking
- Page ID
- 149660
Junto con el centro y la variabilidad, otra medida numérica útil es la clasificación de un número. Un percentil es una medida de clasificación. Representa una medición de ubicación de un valor de datos con respecto al resto de los valores. Muchas pruebas estandarizadas dan los resultados como un percentil. Los médicos también usan percentiles para rastrear el crecimiento de un niño.
El percentil k es el valor de datos que tiene k% de los datos en o por debajo de ese valor.
Ejemplo\(\PageIndex{1}\) interpreting percentile
- ¿Qué significa una puntuación del percentil 90?
- ¿Qué significa una puntuación del percentil 70?
Solución
- Esto significa que el 90% de las puntuaciones estuvieron en o por debajo de esta puntuación. (Una persona hizo lo mismo o mejor que 90% de los tomadores del examen.)
- Esto significa que el 70% de las puntuaciones estuvieron en o por debajo de esta puntuación.
Ejemplo\(\PageIndex{2}\) percentile versus score
Si la prueba estuvo fuera de los 100 puntos y usted anotó en el percentil 80, ¿cuál fue su puntaje en la prueba?
Solución
¡No lo sabes! Todo lo que sabes es que anotaste igual o mejor que el 80% de las personas que tomaron la prueba. Si todos los puntajes fueran realmente bajos, aún podrías haber reprobado la prueba. Por otro lado, si muchos de los puntajes fueran altos podrías haber conseguido un 95% más o menos.
Hay percentiles especiales llamados cuartiles. Los cuartiles son números que dividen los datos en cuartos. Una cuarta parte (o una cuarta parte) de los datos cae entre cuartiles consecutivos.
Definición\(\PageIndex{1}\)
Para encontrar los cuartiles:
- Ordenar los datos en orden creciente.
- Encuentra la mediana, esto divide la lista de datos en 2 mitades.
- Encuentra la mediana de los datos por debajo de la mediana. Este valor es Q1.
- Encuentra la mediana de los datos por encima de la mediana. Este valor es Q3.
Ignorar la mediana en ambos cálculos para Q1 y Q3
Si grabas los cuartiles junto con el máximo y mínimo tienes cinco números. Esto se conoce como el resumen de cinco números. El resumen de cinco números consiste en el mínimo, el primer cuartil (Q1), la mediana, el tercer cuartil (Q3) y el máximo (en ese orden).
El rango intercuartil, IQR, es la diferencia entre el primer y tercer cuartil, Q1 y Q3. La mitad de los datos (50%) cae en el rango intercuartil. Si el IQR es “grande” los datos se dispersan y si el IQR es “pequeño” los datos están más juntos.
Definición\(\PageIndex{2}\)
Rango Intercuartil (IQR)
IQR = Q3 - Q1
Determinación de valores atípicos probables a partir de IQR: cercas
Un valor que es menor que Q1 -\(1.5*\) IQR (este valor a menudo se conoce como una cerca baja) se considera un valor atípico.
De igual manera, un valor que es mayor que Q3\(+1.5*\) IQR (la valla alta) se considera un valor atípico.
Una gráfica de caja (o gráfica de caja y bigotes) es una visualización gráfica del resumen de cinco números. Se puede dibujar vertical u horizontalmente. El formato básico es una caja de Q1 a Q3, una línea vertical a través de la caja para las líneas mediana y horizontal como bigotes que se extienden hacia fuera cada extremo al mínimo y máximo. El mínimo y el máximo se pueden representar con puntos. No olvides etiquetar las marcas de graduación en la recta numérica y darle un título a la gráfica.
Una forma alternativa de una gráfica de caja y bigotes, conocida como una gráfica de caja modificada, solo extiende la línea izquierda hasta el valor más pequeño mayor que la cerca baja, y extiende la línea izquierda hasta el valor más grande menor que la valla alta, y muestra marcadores (puntos, círculos o asteriscos) para cada valores atípicos.
Si los datos son simétricos, entonces la gráfica de caja será visiblemente simétrica. Si la distribución de datos tiene un sesgo izquierdo o un sesgo derecho, la línea en ese lado de la gráfica de caja será visiblemente larga. Si la gráfica es simétrica y los cuatro cuartiles tienen aproximadamente la misma longitud, entonces los datos son probablemente una distribución casi uniforme. Si una gráfica de caja es simétrica, y ambas líneas exteriores son notablemente más largas que la distancia Q1 a mediana y mediana a Q3, la distribución es entonces probablemente en forma de campana.
Ejemplo\(\PageIndex{3}\) five-number summary for an even number of data points
El total de activos en miles de millones de dólares australianos (AUD) de los bancos australianos para el año 2012 se dan en Ejemplo\(\PageIndex{1}\) (“Banco de reserva de,” 2013). Encuentra el resumen de cinco números y el rango intercuartílico (IQR), y dibuja una trama de caja y bigotes.
2855 | 2862 | 2861 | 2884 | 3014 | 2965 |
2971 | 3002 | 3032 | 2950 | 2967 | 2964 |
Solución
Variable: activos\(x =\) totales de bancos australianos
Primero ordene los datos.
2855 | 2861 | 2862 | 2884 | 2950 | 2964 | 2965 | 2967 | 2971 | 3002 | 3014 | 3032 |
El mínimo es de 2855 mil millones de AUD y el máximo es de 3032 mil millones de AUD.
Hay 12 puntos de datos por lo que la mediana es el promedio de los números 6 y 7.
Tabla\(\PageIndex{3}\): Datos Ordenados para Activos Totales con Mediana
Para encontrar QI, busque la mediana de la primera mitad de la lista.
Tabla\(\PageIndex{4}\): Encontrar QI
Para encontrar el tercer trimestre, busque la mediana de la segunda mitad de la lista.
Tabla\(\PageIndex{5}\): Hallazgo Q3
El resumen de cinco números es (todos los números en mil millones de AUD)
Mínimo: 2855
Q1: 2873
Mediana: 2964.5
Q3: 2986.5
Máximo: 3032
Para encontrar la gama intercuartil, IQR, encuentra Q3-Q1
IQR = 2986.5 - 2873 = 113.5 mil millones AUD
Esto le dice que el 50% medio de los activos estaban dentro de 113.5 mil millones de AUD entre sí.
Puedes usar el resumen de cinco números para dibujar la trama de caja y bigotes.
La distribución está sesgada a la derecha porque la cola derecha es más larga.
Ejemplo\(\PageIndex{4}\) five-number summary for an odd number of data points
A continuación se muestra la esperanza de vida de una persona que vive en uno de los 11 países de la región del sudeste asiático en 2012 (“Esperanza de vida en”, 2013). Encuentra el resumen de cinco números para los datos y el IQR, luego dibuja una trama de caja y bigotes.
70 | 67 | 69 | 65 | 69 | 77 |
65 | 68 | 75 | 74 | 64 |
Solución
Variable: esperanza de\(x =\) vida de una persona.
Primero ordene los datos.
64 | 65 | 65 | 67 | 68 | 69 | 69 | 70 | 74 | 75 | 77 |
El mínimo es de 64 años y el máximo es de 77 años.
Hay 11 puntos de datos por lo que la mediana es el 6º número de la lista.
Tabla\(\PageIndex{8}\): Hallar la mediana de las expectativas de vida
Al encontrar el Q1 y Q3 necesitas encontrar la mediana de los números por debajo de la mediana y por encima de la mediana. La mediana no está incluida en ninguno de los cálculos.
Tabla\(\PageIndex{9}\): Hallazgo Q1
Tabla\(\PageIndex{10}\): Hallazgo Q3
Q1 = 65 años y Q3 =74 años
El resumen de cinco números es (en años)
Mínimo: 64
Q1: 65
Mediana: 69
Q3: 74
Máximo: 77
Para encontrar la gama intercuartil (IQR)
IQR = Q3-Q1 =74-65=9 años
El 50% medio de las expectativas de vida se encuentran dentro de los 9 años.
Esta distribución se ve algo sesgada a la derecha, ya que el bigote es más largo a la derecha. Sin embargo, también podría considerarse casi simétrica ya que la caja parece algo simétrica.
Se pueden dibujar 2 parcelas de caja una al lado de la otra (o una encima de la otra) para comparar 2 muestras. Ya que desea comparar los dos conjuntos de datos, asegúrese de que las gráficas de caja estén en los mismos ejes. Como ejemplo, supongamos que nos fijamos en el plan de caja y bigotes para la esperanza de vida para los países europeos y los países del sudeste asiático.
Al mirar la trama de caja y bigotes, notarás que los tres cuartiles para la esperanza de vida son todos mayores para los países europeos, sin embargo, la esperanza de vida mínima para los países europeos es menor que la de los países del sudeste asiático. La esperanza de vida para los países europeos parece estar sesgada a la izquierda, mientras que las expectativas de vida para los países del sudeste asiático parecen ser más simétricas. Por supuesto, hay más cualidades que se pueden comparar entre las dos gráficas.
Para encontrar el resumen de cinco números usando R, el comando es:
variable<-c (escriba datos con comas)
resumen (variable)
Este comando te dará el resumen de cinco números y la media.
Por ejemplo\(\PageIndex{4}\), los comandos serían
expectancia<-c (70, 67, 69, 65, 69, 69, 77, 65, 68, 75, 74, 64)
resumen (expectativa)
El resultado sería:
\(\begin{array}{cccccc}{\text { Min.}} & {\text{ Ist Qu.}} & {\text{Median}} & {\text{Mean}} & {\text{3rd Qu.}} & {\text{Max.}} \\ {64.00} & {66.00} & {69.00} & {69.36} & {72.00} & {77.00} \end{array}\)
Para dibujar la gráfica de caja el comando es boxplot (variable, main="title you want”, xlab="label you want”, horizontal = TRUE). La horizontal = VERDADERO orienta la gráfica de caja para que sea horizontal. Si dejas esa parte apagada, la gráfica de caja será vertical por defecto.
Por ejemplo\(\PageIndex{4}\), el comando es
boxplot (expectativa, main="Esperanza de vida de los países del sudeste asiático en 2011", horizontal=true, xlab="Esperanza de vida”)
Deberías obtener la parcela de caja en la Gráfica 3.3.4.
Esto se conoce como una gráfica de caja modificada. En lugar de trazar el máximo y el mínimo, la gráfica de caja tiene como línea inferior Q1 -1.5* IQR, y como línea superior, Q3 +1.5* IQR. Cualquier valor por debajo de la línea inferior o por encima de la línea superior se considera valores atípicos. Los valores atípicos se trazan como puntos en la gráfica de caja modificada. Este conjunto de datos no tiene ningún valor atípico.
Ejemplo\(\PageIndex{5}\) putting it all together
Se recolectó una muestra aleatoria sobre los gastos en salud (como% del PIB) de países de todo el mundo. Los datos están en Ejemplo\(\PageIndex{11}\). Mediante estadísticas descriptivas gráficas y numéricas, analizar los datos y utilizarlos para predecir los gastos en salud de todos los países del mundo.
3.35 | 5.94 | 10.64 | 5.24 | 3.79 | 5.65 | 7.66 | 7.38 | 5.87 | 11.15 |
5.96 | 4.78 | 7.75 | 2.72 | 9.50 | 7.69 | 10.05 | 11.96 | 8.18 | 6.74 |
5.89 | 6.20 | 5.98 | 8.83 | 6.78 | 6.66 | 9.45 | 5.41 | 5.16 | 8.55 |
Solución
Primero, podría ser útil mirar una visualización de los datos, así que cree un histograma.
A partir de la gráfica, los datos parecen estar algo sesgados a la derecha. Por lo que hay algunos países que gastan más en salud basado en un porcentaje del PIB que otros países, pero la mayoría de los países parecen gastar alrededor del 4 al 8% de su PIB en salud.
Las descripciones numéricas también podrían ser útiles. Usando la tecnología, la media es 7.03%, la desviación estándar es 2.27%, y el resumen de cinco números es mínimo = 2.72%, Q1 = 5.71%, mediana = 6.70%, Q3 = 8.46%, y máximo = 11.96%. Para visualizar el resumen de cinco números, cree una gráfica de caja.
Por lo que parece que los países gastan en promedio alrededor del 7% de su GPD en salud. El spread es algo bajo, ya que la desviación estándar es bastante pequeña, lo que significa que los datos son bastante consistentes. El resumen de cinco números confirma que los datos están ligeramente sesgados a la derecha. La trama de caja muestra que no hay valores atípicos. Entonces, a partir de toda esta información, se podría decir que los países gastan un pequeño porcentaje de su PIB en salud y que la mayoría de los países gastan alrededor de la misma cantidad. No parece haber ningún país que gaste mucho más que otros países o mucho menos que otros países.
Tarea
Ejercicio\(\PageIndex{1}\)
- Supongamos que tomas una prueba estandarizada y estás en el percentil 10. ¿Qué significa este percentil? ¿Puedes decir que reprobaste la prueba? Explique.
- Supongamos que su hijo toma un examen estandarizado en matemáticas y puntúa en el percentil 96. ¿Qué significa este percentil? ¿Puedes decir que tu hijo pasó la prueba? Explique.
- Supongamos que su hijo está en el percentil 83 en estatura y en el percentil 24 en peso. Describa lo que esto le dice sobre la estatura de su hijo.
- Supongamos que su trabajo evalúa a los empleados y los coloca en un ranking percentil. Si tu evaluación está en el percentil 65, ¿crees que estás trabajando lo suficiente? Explique.
- Los niveles de colesterol se recolectaron de los pacientes dos días después de sufrir un ataque al corazón (Ryan, Joiner & Ryan, Jr, 1985) y están en Ejemplo\(\PageIndex{12}\). Encuentre el resumen de cinco números y el rango intercuartílico (IQR), y dibuje una trama de caja y bigotes.
270 236 210 142 280 272 160 220 226 242 186 266 206 318 294 282 234 224 276 282 360 310 280 278 288 288 244 236 Tabla\(\PageIndex{12}\): Niveles de colesterol - Las longitudes (en kilómetros) de los ríos de la Isla Sur de Nueva Zelanda que fluyen hacia el Océano Pacífico se enumeran en Example\(\PageIndex{13}\) (Lee, 1994). Encuentre el resumen de cinco números y el rango intercuartílico (IQR), y dibuje una trama de caja y bigotes.
Río Longitud (km) Río Longitud (km) Clarence 209 Clutha 322 Conway 48 Taieri 288 Waiau 169 Shag 72 Hurunui 169 Kakanui 64 Waipara 64 Waitaki 209 Ashley 97 Waihao 64 Waimakariri 161 Pareora 56 Selwyn 95 Rangitata 121 Rakaia 145 Ophi 80 Ashburton 90 Tabla\(\PageIndex{13}\): Longitudes de ríos (km) que fluyen hacia el Océano Pacífico - Las longitudes (en kilómetros) de los ríos de la Isla Sur de Nueva Zelanda que desembocan en el Mar de Tasmania se enumeran en Example\(\PageIndex{14}\) (Lee, 1994). Encuentre el resumen de cinco números y el rango intercuartílico (IQR), y dibuje una trama de caja y bigotes.
Río Longitud (km) Río Longitud (km) Hollyford 76 Waimea 48 Cascade 64 Motueka 108 Arawhata 68 Takaka 72 Haast 64 Aorere 72 Karangarua 37 Heaphy 35 Cocinero 32 Karamea 80 Waiho 32 Mokihinui 56 Whataroa 51 Buller 177 Wanganui 56 Gris 121 Waitaha 40 Taramakau 80 Hokitika 64 Arahura 56 Tabla\(\PageIndex{14}\): Longitudes de ríos (km) que fluyen al mar de Tasmania - Eyeglassmatic fabrica anteojos para sus minoristas. Prueban para ver cuántas lentes defectuosas hicieron el periodo de tiempo del 1 de enero al 31 de marzo. Ejemplo\(\PageIndex{15}\) da el defecto y el número de defectos. Encuentre el resumen de cinco números y el rango intercuartílico (IQR), y dibuje una trama de caja y bigotes.
Tipo de defecto Número de defectos Rasguño 5865 Forma derecha - pequeña 4613 Descamado 1992 Eje incorrecto 1838 El chaflán está mal 1596 Ranuras, grietas 1546 Forma incorrecta 1485 PD incorrecto 1398 Manchas y burbujas 1371 Altura incorrecta 1130 Forma derecha - grande 1105 Perdido en laboratorio 976 Manchas/Burbuja - pasante 976 Tabla\(\PageIndex{15}\): Número de lentes defectuosos - Se realizó un estudio para ver el efecto del ejercicio sobre la frecuencia del pulso. Se tomaron sujetos varones que no fuman, pero sí beben. Se midieron sus frecuencias de pulso (“Pulso antes”, 2013). Después corrieron en su lugar durante un minuto y luego volvieron a medir su frecuencia de pulso. La gráfica 3.3.7 es de parcelas de caja y bigotes que se crearon de las frecuencias de pulso antes y después. Discuta cualquier conclusión que pueda sacar de las gráficas.
Gráfica 3.3.7: Gráfica de cajas y bigotes de frecuencias de pulso para machos - Se realizó un estudio para ver el efecto del ejercicio sobre la frecuencia del pulso. Se tomaron sujetos femeninos que no fuman, pero sí beben. Se midieron sus frecuencias de pulso (“Pulso antes”, 2013). Después corrieron en su lugar durante un minuto, y luego volvieron a medir su frecuencia de pulso. La gráfica 3.3.8 es de parcelas de caja y bigotes que se crearon de las frecuencias de pulso antes y después. Discuta cualquier conclusión que pueda sacar de las gráficas.
Gráfica 3.3.8: Gráfica de cajas y bigotes de frecuencias de pulso para hembras - Para determinar si el Reiki es un método efectivo para tratar el dolor, se realizó un estudio piloto donde un terapeuta de Reiki certificado de segundo grado brindó tratamiento a voluntarios. El dolor se midió mediante una escala visual analógica (EVA) inmediatamente antes y después del tratamiento de Reiki (Olson & Hanson, 1997). La gráfica 3.3.9 es de parcelas de caja y bigotes que se crearon de las calificaciones VAS antes y después. Discuta cualquier conclusión que pueda sacar de las gráficas.
Gráfica 3.3.9: Gráfica de dolor de caja y bigotes usando Reiki - El número de muertes atribuidas a la radiación UV en países africanos y países del Medio Oriente en el año 2002 fueron recolectados por la Organización Mundial de la Salud (“UV radiation: Burden”, 2013). La gráfica 3.3.10 es de tramas de caja y bigotes que se crearon de las muertes en países africanos y muertes en países del Medio Oriente. Discuta cualquier conclusión que pueda sacar de las gráficas.
Gráfica 3.3.10: Gráfica de cajas y bigotes de muertes por radiación UV en diferentes regiones
- Contestar
-
Nota: Q1, Q3 e IQR pueden diferir ligeramente debido a cómo la tecnología los encuentra.
1. Ver soluciones
3. Ver soluciones
5. min = 142, Q1 = 225, med = 268, Q3 = 282, max = 360, IQR = 57, ver soluciones
7. min = 32 km, Q1 = 46 km, med = 64 km, Q3 = 77 km, max = 177 km, IQR = 31 km, ver soluciones
9. Ver soluciones
11. Ver soluciones
Fuentes de datos:
Máximo anual de precipitaciones diarias en Sydney. (2013, 25 de septiembre). Recuperado a partir de http://www.statsci.org/data/oz/sydrain.html
Lee, A. (1994). Análisis de datos: Una introducción basada en r. Auckland. Recuperado a partir de http://www.statsci.org/data/oz/nzrivers.html
Esperanza de vida en el sudeste asiático. (2013, 23 de septiembre). Recuperado a partir de http://apps.who.int/gho/data/node.main.688
Olson, K., & Hanson, J. (1997). Uso del reiki para manejar el dolor: un reporte preliminar. Cáncer Prev Control, 1 (2), 108-13. Recuperado a partir de http://www.ncbi.nlm.nih.gov/pubmed/9765732
Pulso antes y después del ejercicio. (2013, 25 de septiembre). Recuperado a partir de http://www.statsci.org/data/oz/ms212.html
Banco de reserva de Australia. (2013, 23 de septiembre). Recuperado a partir de http://data.gov.au/dataset/banks-assets
Ryan, B. F., Joiner, B. L., & Ryan, Jr, T. A. (1985). Niveles de colesterol después de un ataque cardíaco. Recuperado a partir de http://www.statsci.org/data/general/cholest.html
Tiempo entre pulsos nerviosos. (2013, 25 de septiembre). Recuperado a partir de http://www.statsci.org/data/general/nerve.html
Tiempo de pasajes de juego en el rugby. (2013, 25 de septiembre). Recuperado a partir de http://www.statsci.org/data/oz/rugby.html
Climatología de tornados en Estados Unidos. (17, mayo de 2013). Recuperado de www.ncdc.noaa.gov/oa/climate/... tornadoes.html
Radiación UV: Carga de enfermedad por país. (2013, 4 de septiembre). Recuperado a partir de http://apps.who.int/gho/data/node.main.165?lang=en