# 18.3: Aprender lo básico y aprenderlos en R

Bien, eso fue... largo. E incluso ese listado está masivamente incompleto. Realmente hay muchas ideas grandes en las estadísticas que no he cubierto en este libro. Puede parecer bastante deprimente terminar un libro de texto de 600 páginas solo para que te digan que esto solo es el comienzo, sobre todo cuando empiezas a sospechar que la mitad de las cosas que te han enseñado están equivocadas. Por ejemplo, hay mucha gente en el campo que argumentaría fuertemente en contra del uso del modelo clásico ANOVA, ¡sin embargo, le he dedicado dos capítulos enteros! El ANOVA estándar puede ser atacado desde una perspectiva bayesiana, o desde una perspectiva estadística robusta, o incluso desde una perspectiva de “es simplemente incorrecta” (las personas usan con mucha frecuencia ANOVA cuando realmente deberían estar usando modelos mixtos). Entonces, ¿por qué aprenderlo en absoluto?

Según lo veo, hay dos argumentos clave. En primer lugar, está el argumento del pragmatismo puro. Con razón o equivocadamente, el ANOVA es ampliamente utilizado. Si quieres entender la literatura científica, necesitas entender el ANOVA. Y en segundo lugar, está el argumento del “conocimiento incremental”. De la misma manera que fue útil haber visto ANOVA unidireccional antes de intentar aprender ANOVA factorial, comprender ANOVA es útil para comprender herramientas más avanzadas, porque muchas de esas herramientas se extienden o modifican la configuración básica del ANOVA de alguna manera. Por ejemplo, aunque los modelos mixtos son mucho más útiles que el ANOVA y la regresión, nunca he oído hablar de nadie aprendiendo cómo funcionan los modelos mixtos sin antes haber trabajado a través de ANOVA y regresión. Tienes que aprender a gatear antes de poder escalar una montaña.

En realidad, quiero empujar un poco más este punto. Una cosa que he hecho mucho en este libro es hablar de fundamentos. Pasé mucho tiempo en la teoría de la probabilidad. Hablé sobre la teoría de la estimación y las pruebas de hipótesis con más detalle de lo que necesitaba. Al hablar de R, pasé mucho tiempo hablando de cómo funciona el lenguaje, y hablando de cosas como escribir tus propios guiones, funciones y programas. No solo te enseñé a dibujar un histograma usando hist (), intenté dar una visión básica de cómo funciona el sistema gráfico. ¿Por qué hice todo esto? Mirando hacia atrás, podría preguntarse si realmente necesitaba pasar todo ese tiempo hablando sobre qué es una distribución de probabilidad, o por qué había incluso una sección sobre densidad de probabilidad. Si el objetivo del libro era enseñarte a realizar una prueba t o un ANOVA, ¿era todo eso realmente necesario? O, ahora que lo pienso, ¿por qué molestarse con R en absoluto? Hay muchas alternativas gratuitas por ahí: PSPP, por ejemplo, es un clon similar a SPSS que es totalmente gratuito, tiene menús simples de “apuntar y hacer clic”, y puede (creo) hacer todos los análisis de los que he hablado en este libro. Y podrás aprender PSPP en aproximadamente 5 minutos. ¿Todo esto fue solo una enorme pérdida de tiempo de todos???

La respuesta, espero que estés de acuerdo, es no. El objetivo de una estadística introductoria no es enseñar ANOVA. No es para enseñar pruebas t, o regresiones, o histogramas, o valores p. El objetivo es iniciarte en el camino hacia convertirte en un analista de datos calificado. Y para que te conviertas en un experto analista de datos, necesitas poder hacer más que ANOVA, más que pruebas t, regresiones e histogramas. Necesitas poder pensar correctamente sobre los datos. Es necesario poder conocer los modelos estadísticos más avanzados de los que hablé en la última sección, y comprender la teoría en la que se basan. Y necesitas tener acceso a un software que te permita usar esas herramientas avanzadas. Y aquí es donde —en mi opinión al menos— todo ese tiempo extra que he dedicado a los fundamentos vale la pena. Si entiendes el sistema gráfico en R, entonces puedes dibujar las parcelas que quieras, no solo las parcelas enlatadas que alguien más ha construido en R para ti. Si entiendes la teoría de la probabilidad, te resultará mucho más fácil pasar de los análisis frecuentistas a los bayesianos. Si entiendes la mecánica central de R, te resultará mucho más fácil generalizar desde regresiones lineales usando lm () hasta usar modelos lineales generalizados con glm () o modelos de efectos mixtos lineales usando lme () y lmer (). Incluso encontrarás que un conocimiento básico de R te ayudará en gran medida a enseñarte a usar otros lenguajes de programación estadística que se basan en él. Los bayesianos frecuentemente confían en herramientas como WinBugs y JAGS, que tienen una serie de similitudes con R, y de hecho pueden llamarse desde dentro de R. De hecho, debido a que R es la “lingua franca de la estadística”, lo que encontrarás es que la mayoría de las ideas en la literatura estadística se han implementado en alguna parte como un paquete que se puede descargar desde CRAN. No se puede decir lo mismo del PSPP, ni siquiera del SPSS.

Y lo que espero es que este libro —o el libro terminado en el que esto algún día se convertirá— pueda ayudarte con eso.

Referencias

This page titled 18.3: Aprender lo básico y aprenderlos en R is shared under a CC BY-SA 4.0 license and was authored, remixed, and/or curated by Danielle Navarro via source content that was edited to the style and standards of the LibreTexts platform.