Referencias y Tarjetas de Referencia
- Page ID
- 150066
Hay océanos de literatura sobre estadística, sobre R y sobre ambos. A continuación se muestra una pequeña selección de publicaciones que o bien se mencionan en el texto, o podrían ser realmente útiles (como pensamos) a los lectores de este libro.
2em-2em1ex
Cleveland W. S. 1985. Los elementos de graficar los datos. Wandsworth Libros Avanzados y Software. 323 p.
Crawley M. 2007. R Libro. John Whiley & Sons. 942 p.
Dalgaard P. 2008. Estadísticas introductorias con R. 2 ed. Springer Science Business Media. 363 p.
Efron B. 1979. Métodos Bootstrap: Otra mirada a la Jackknife. Ann. Estatista. 7 (1): 1—26.
Gonick L., Smith W. 1993. La guía de dibujos animados para las estadísticas. HarperCollins. 230 p.
Kaufman L., Rousseeuw P. J. 1990. Encontrar grupos en los datos: una introducción al análisis de conglomerados. Wiley-Interscience. 355 p.
Kimble G. A. 1978. Cómo utilizar (y mal uso) las estadísticas. Prentice Hall. 290 p.
Li Ray. Los 10 mejores algoritmos de minería de datos en inglés sencillo. URL: http://rayli.net/blog/data/top-10-data-mining-algorithms-in-plain-english/
Li Ray. Top 10 algoritmos de minería de datos en llano R. URL: http://rayli.net/blog/data/top-10-data-mining-algorithms-in-plain-r/
Marriott F. H. C. 1974. La interpretación de múltiples observaciones. Prensa Académica. 117 p.
McKillup S. 2011. Estadísticas explicadas. Una guía introductoria para científicos de la vida. Prensa de la Universidad de Cambridge. 403 p.
Murrell P. 2006. Gráficos R. Chapman & Hall/CRC. 293 p.
Petrie A., Sabin C. 2005. Estadísticas médicas de un vistazo. John Wiley & Sons. 157 p.
R Equipo Núcleo de Desarrollo. R: Un lenguaje y entorno para la computación estadística. R Foundation for Statistical Computing, Viena, Austria.
Rowntree D. 2000. Estadísticas sin lágrimas. Arcillas. 195 p.
Sokal R. R., Rolf F. J. 2012. Biometría. Los principios y la práctica de la estadística en la investigación biológica. W.H. Freeman y Compañía. 937 p.
Sprent P. 1977. Estadísticas en Acción. Libros de pingüinos. 240 p.
Tukey J. W. 1977. Análisis Exploratorio de Datos. Pearson. 688 p.
Venables W. N., Ripley B. D. 2002. Estadística aplicada moderna con S. 4ª ed. Springer. 495 p.
¡Feliz Análisis de Datos!
Y solo un recordatorio: si usas R y te gusta, no olvides citarlo. Ejecute el comando citation ()
para ver cómo.
Las tarjetas de referencia se adjuntan al final del libro. Tienen un formato de página diferente, más adecuado para la impresión. El primero fue en realidad una página “cheatsheet”; recomendamos imprimir es y usar mientras aprendes R.
- https://xkcd.com/thing-explainer/ ↩
- Sin embargo, existe el paquete
SOAR
que anula este comportamiento. ↩ - Si no utiliza estos gerentes o centros, se recomienda actualizar regularmente su R, al menos una vez al año. ↩
- Hay comando
Xpager ()
en la colección de comandosasmisc.r
, permite ver ayuda en la ventana separada incluso si trabajas en terminal. ↩ - Dentro de paréntesis inmediatamente después del ejemplo, vamos a proporcionar comentarios. ↩
- Por cierto, en los sistemas Linux puede salir de R también con la tecla
Ctrl+D
, y en Windows con la teclaCrtl+Z
. ↩ - Por lo general, los ejercicios pequeños están en negrita. ↩
- Por cierto, si quieres el número de Euler,\(e\), escribe
exp (1)
. ↩ - Y también como editor que está incrustado en R para Windows o en la GUI de R macOS, o el editor del paquete
rite
R, ¡pero no software de oficina como MS Word o Excel! ↩ - Otra posibilidad es establecer directorio de trabajo en preferencias (esto es bastante diferente entre sistemas operativos) pero esta no es la mejor solución porque podría (y probablemente querrá) diferentes directorios de trabajo para diferentes tareas. ↩
- Hay paquete
rio
que puede determinar la estructura de los datos. ↩ - Nuevamente, descárguelo primero de Internet al subdirectorio de
datos
. Alternativamente, reemplace el subdirectorio con URL y cárguelo en R directamente, por supuesto, después de verificar la estructura. ↩ - En macOS, escriba
Enter
dos veces. ↩ - Con los comandos
dput ()
ydget ()
, R también guarda y carga representaciones textuales de objetos. ↩ - Esto es un poco similar a la broma sobre matemático que, para hervir la tetera llena de agua, la vaciaría primero y por lo tanto reduciría el problema a uno que ya estaba resuelto! ↩
- Si, por casualidad, empezó y no tienes idea de cómo dejar de fumar, presiona
ZQ
mayúscula. ↩ - Dentro de nano, usa
Ctrl+O
para guardar tus ediciones yCtrl+X
para salir. ↩ - No funciona en macOS gráficos. ↩
- Bajo MacOS gráfico, este comando no es accesible, y es necesario utilizar el menú de la aplicación. ↩
- También puede usar el comando
savehistory ()
para hacer un script “starter”. ↩ - En Windows y macOS, esto abrirá el editor interno; en Linux, es mejor establecer la opción del
editor
manualmente, por ejemplo,file.edit (“hola.r”, editor="geany”)
. ↩ - El mejor término es comando genérico. ↩
- Cleveland W. S., McGill R. 1985. Percepción gráfica y métodos gráficos para el análisis de datos científicos. Ciencia. 229 (4716): 828—833. ↩
celosía
surgió de ideas posteriores de W.S. Cleveland, parcelas enrejadas (condicionales) (ver más abajo para más ejemplos). ↩ggplot2
es ahora el sistema gráfico R más de moda. Obsérvese, sin embargo, que se basa en la diferente “ideología” que se relacionaba más con el software de estadística visual SYSTAT y por lo tanto es ajena a R. ↩- Por cierto, tanto PDF como SVG podrían abrirse y editarse con el editor vectorial disponible gratuitamente Inkscape. ↩
- Colección
gmoon.r
tiene el comando similar a un juegoMiney ()
, basado enlocator ()
; en parte imita al famoso juego “buscaminas”. ↩ - En el caso de nuestro marco de datos de
huevos
, el comando de segundo estilo seríaplot (eggs [, 1:2])
oplot (huevos$v1, huevos$v2)
, ver más explicaciones en el siguiente capítulo. ↩ - Otra variante es utilizar la función
scatter.smooth ()
de alto nivel que reemplazaplot ()
. La tercera alternativa es unsuavizado cúbico suave.spline ()
que calcula números para usar conlíneas ()
. ↩ - De hecho, los datos de medición discretos son más útiles para las computadoras: como ya sabrás, los procesadores se basan en la lógica 0/1 y no entienden fácilmente los números flotantes no integrales. ↩
- Para palabras desconocidas, consulte el glosario al final del libro. ↩
- Por defecto,
Ls ()
no genera funciones de salida. Si es necesario, este comportamiento podría cambiarse conLs (exclude="none”)
. ↩ - De hecho, las columnas de marcos de datos pueden ser también matrices u otros marcos de datos, pero esta característica rara vez es útil. ↩
- También hay paquete
hexbin
que utiliza formas hexagonales y sombreado de color. ↩ - Paquete
DESCTools
tiene la práctica funciónMode ()
para calcular el modo. ↩ - Si bien es posible ejecutar aquí un ciclo usando
para
operador,aplicar
como las funciones son siempre preferibles. ↩ - En el libro, incluimos mínimo y máximo en cuartiles. ↩
- Tenga en cuenta que estas opciones deben establecerse a priori, antes de ejecutar la prueba. No se permite cambiar alternativas para encontrar un mejor p-valores. ↩
- Mira también al final de este capítulo. ↩
- Sin embargo, hay una solución alternativa, prueba de orden de rango robusta, busque la función
rro.test ()
enasmisc.r
. ↩ - Bennett C.M., Wolford G.L., Miller M.B. 2009. El control de principios de los falsos positivos en la neuroimagen. Neurociencia social cognitiva y afectiva 4 (4): 417—422, https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2799957/ ↩
- Al igual que se implementa en el paquete
ARTool
; también es posible utilizar diseños no paramétricos de múltiples vías. ↩ - Fisher R.A. 1971. El diseño de experimentos. 9ª ed. P. 11. ↩
- Mendel G. 1866. Versuche über Pflanzen-Hybriden. Verhandlungen des naturforschenden Vereines en Brünn. Bd. 4, Abhandlungen: 12. http://biodiversitylibrary.org/page/40164750 ↩
- Yates F. 1934. Tablas de contingencia que involucran números pequeños y la\(\chi^2\) prueba. Revista de la Real Sociedad Estadística. 1 (2): 217—235. ↩
- Existen, sin embargo, técnicas avanzadas con el objetivo de entender la diferencia entre causalidad y correlación: por ejemplo, las implementadas en el paquete
bnlearn
. ↩ - La función
Cladd ()
es aplicable solo a modelos lineales simples. Si quieres bandas de confianza en casos más complejos, comprueba el códigoCladd ()
para ver qué hace exactamente. ↩ - Fisher R.A. 1936. El uso de múltiples mediciones en problemas taxonómicos. Anales de Eugenesia. 7 (2): 179—188. ↩
- Paquete
Boruta
es especialmente dios para toda la selección de características relevantes. ↩ - Por ejemplo, “Enciclopedia de distancias” (2009) menciona ¡alrededor de 1,500! ↩
- Énfasis mío. ↩
- Con
fuente de comando (“ashipunov.info/r/gmoon.r”)
. ↩ - Para saber qué símbolos están disponibles, ejecute
demo (Hershey)
. ↩ - Los usuarios de Linux podrían querer agregar la opción
editor=
. ↩ - El paquete
lintr
contiene el comandolint ()
que comprueba los scripts R. ↩ - Por cierto, hay un truco de vida para el lector perezoso: todas las parcelas que necesitas hacer tú mismo están realmente presentes en el archivo PDF de salida. ↩
- Entre los editores de texto, Geany es uno de los más universales, rápidos, gratuitos y funciona en la mayoría de los sistemas operativos. ↩
- Thompson D. W. 1945. Sobre el crecimiento y la forma. Cambridge, Nueva York. 1140 pp. ↩
- Rohlf F.J. TPSDig. Departamento de Ecología y Evolución, Universidad Estatal de Nueva York en Stony Brook. Disponible gratuitamente en life.bio.sunysb.edu/morph/ ↩
- En realidad, el paquete
geomorfo
es capaz de digitalizar imágenes con la funcióndigitize2d ()
pero solo funciona con imágenes JPEG. ↩