Saltar al contenido principal

# 3: Empezando con R

$$\newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} }$$

$$\newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}}$$

$$\newcommand{\id}{\mathrm{id}}$$ $$\newcommand{\Span}{\mathrm{span}}$$

( \newcommand{\kernel}{\mathrm{null}\,}\) $$\newcommand{\range}{\mathrm{range}\,}$$

$$\newcommand{\RealPart}{\mathrm{Re}}$$ $$\newcommand{\ImaginaryPart}{\mathrm{Im}}$$

$$\newcommand{\Argument}{\mathrm{Arg}}$$ $$\newcommand{\norm}[1]{\| #1 \|}$$

$$\newcommand{\inner}[2]{\langle #1, #2 \rangle}$$

$$\newcommand{\Span}{\mathrm{span}}$$

$$\newcommand{\id}{\mathrm{id}}$$

$$\newcommand{\Span}{\mathrm{span}}$$

$$\newcommand{\kernel}{\mathrm{null}\,}$$

$$\newcommand{\range}{\mathrm{range}\,}$$

$$\newcommand{\RealPart}{\mathrm{Re}}$$

$$\newcommand{\ImaginaryPart}{\mathrm{Im}}$$

$$\newcommand{\Argument}{\mathrm{Arg}}$$

$$\newcommand{\norm}[1]{\| #1 \|}$$

$$\newcommand{\inner}[2]{\langle #1, #2 \rangle}$$

$$\newcommand{\Span}{\mathrm{span}}$$ $$\newcommand{\AA}{\unicode[.8,0]{x212B}}$$

$$\newcommand{\vectorA}[1]{\vec{#1}} % arrow$$

$$\newcommand{\vectorAt}[1]{\vec{\text{#1}}} % arrow$$

$$\newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} }$$

$$\newcommand{\vectorC}[1]{\textbf{#1}}$$

$$\newcommand{\vectorD}[1]{\overrightarrow{#1}}$$

$$\newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}}$$

$$\newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}}$$

$$\newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} }$$

$$\newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}}$$

$$\newcommand{\avec}{\mathbf a}$$ $$\newcommand{\bvec}{\mathbf b}$$ $$\newcommand{\cvec}{\mathbf c}$$ $$\newcommand{\dvec}{\mathbf d}$$ $$\newcommand{\dtil}{\widetilde{\mathbf d}}$$ $$\newcommand{\evec}{\mathbf e}$$ $$\newcommand{\fvec}{\mathbf f}$$ $$\newcommand{\nvec}{\mathbf n}$$ $$\newcommand{\pvec}{\mathbf p}$$ $$\newcommand{\qvec}{\mathbf q}$$ $$\newcommand{\svec}{\mathbf s}$$ $$\newcommand{\tvec}{\mathbf t}$$ $$\newcommand{\uvec}{\mathbf u}$$ $$\newcommand{\vvec}{\mathbf v}$$ $$\newcommand{\wvec}{\mathbf w}$$ $$\newcommand{\xvec}{\mathbf x}$$ $$\newcommand{\yvec}{\mathbf y}$$ $$\newcommand{\zvec}{\mathbf z}$$ $$\newcommand{\rvec}{\mathbf r}$$ $$\newcommand{\mvec}{\mathbf m}$$ $$\newcommand{\zerovec}{\mathbf 0}$$ $$\newcommand{\onevec}{\mathbf 1}$$ $$\newcommand{\real}{\mathbb R}$$ $$\newcommand{\twovec}[2]{\left[\begin{array}{r}#1 \\ #2 \end{array}\right]}$$ $$\newcommand{\ctwovec}[2]{\left[\begin{array}{c}#1 \\ #2 \end{array}\right]}$$ $$\newcommand{\threevec}[3]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \end{array}\right]}$$ $$\newcommand{\cthreevec}[3]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \end{array}\right]}$$ $$\newcommand{\fourvec}[4]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}$$ $$\newcommand{\cfourvec}[4]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}$$ $$\newcommand{\fivevec}[5]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}$$ $$\newcommand{\cfivevec}[5]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}$$ $$\newcommand{\mattwo}[4]{\left[\begin{array}{rr}#1 \amp #2 \\ #3 \amp #4 \\ \end{array}\right]}$$ $$\newcommand{\laspan}[1]{\text{Span}\{#1\}}$$ $$\newcommand{\bcal}{\cal B}$$ $$\newcommand{\ccal}{\cal C}$$ $$\newcommand{\scal}{\cal S}$$ $$\newcommand{\wcal}{\cal W}$$ $$\newcommand{\ecal}{\cal E}$$ $$\newcommand{\coords}[2]{\left\{#1\right\}_{#2}}$$ $$\newcommand{\gray}[1]{\color{gray}{#1}}$$ $$\newcommand{\lgray}[1]{\color{lightgray}{#1}}$$ $$\newcommand{\rank}{\operatorname{rank}}$$ $$\newcommand{\row}{\text{Row}}$$ $$\newcommand{\col}{\text{Col}}$$ $$\renewcommand{\row}{\text{Row}}$$ $$\newcommand{\nul}{\text{Nul}}$$ $$\newcommand{\var}{\text{Var}}$$ $$\newcommand{\corr}{\text{corr}}$$ $$\newcommand{\len}[1]{\left|#1\right|}$$ $$\newcommand{\bbar}{\overline{\bvec}}$$ $$\newcommand{\bhat}{\widehat{\bvec}}$$ $$\newcommand{\bperp}{\bvec^\perp}$$ $$\newcommand{\xhat}{\widehat{\xvec}}$$ $$\newcommand{\vhat}{\widehat{\vvec}}$$ $$\newcommand{\uhat}{\widehat{\uvec}}$$ $$\newcommand{\what}{\widehat{\wvec}}$$ $$\newcommand{\Sighat}{\widehat{\Sigma}}$$ $$\newcommand{\lt}{<}$$ $$\newcommand{\gt}{>}$$ $$\newcommand{\amp}{&}$$ $$\definecolor{fillinmathshade}{gray}{0.9}$$

—Roger Zelazny 13

En este capítulo voy a discutir cómo empezar en R. Hablaré brevemente sobre cómo descargar e instalar R, pero la mayor parte del capítulo estará enfocado en que comiences a escribir comandos R. Nuestro objetivo en este capítulo no es aprender ningún concepto estadístico: solo estamos tratando de aprender los conceptos básicos de cómo funciona R y sentirnos cómodos interactuando con el sistema. Para ello, pasaremos un poco de tiempo usando R como una calculadora simple, ya que eso es lo más fácil de hacer con R. Al hacerlo, te darás una idea de lo que es trabajar en R. A partir de ahí voy a introducir algunas ideas de programación muy básicas: en particular, voy a hablar de la idea de definir variables para almacenar información, y algunas cosas que puedes hacer con estas variables.

Sin embargo, antes de entrar en cualquiera de los detalles, vale la pena hablar un poco sobre por qué es posible que desee usar R en absoluto. Dado que estás leyendo esto, probablemente tengas tus propias razones. No obstante, si esas razones son “porque eso es lo que usa mi clase de estadísticas”, podría valer la pena explicar un poco por qué tu profesor ha optado por usar R para la clase. Por supuesto, realmente no sé por qué otras personas eligen R, así que realmente estoy hablando de por qué la uso.

• Es algo obvio, pero vale la pena decirlo de todos modos: hacer tus estadísticas en una computadora es más rápido, más fácil y más poderoso que hacer estadísticas a mano. Las computadoras sobresalen en tareas repetitivas sin sentido, y muchos cálculos estadísticos son a la vez insensatos y repetitivos. Para la mayoría de las personas, la única razón para hacer cálculos estadísticos con lápiz y papel es para fines de aprendizaje. En mi clase de vez en cuando sugiero hacer algunos cálculos de esa manera, pero el único valor real para ello es pedagógico. Te ayuda a tener una “idea” de las estadísticas para hacer algunos cálculos tú mismo, así que vale la pena hacerlo una vez. ¡Pero solo una vez!
• Hacer estadísticas en una hoja de cálculo (por ejemplo, Microsoft Excel) es generalmente una mala idea a largo plazo. Aunque es probable que muchas personas se sientan más familiarizadas con ellas, las hojas de cálculo son muy limitadas en cuanto a qué análisis te permiten hacer. Si te acostas a tratar de hacer tu análisis de datos de la vida real usando hojas de cálculo, entonces te has cavado en un agujero muy profundo.
• Evitar el software propietario es una muy buena idea. Hay muchos paquetes comerciales por ahí que puedes comprar, algunos de los cuales me gustan y otros no, suelen ser muy brillantes en su apariencia, y generalmente muy potentes (mucho más potentes que las hojas de cálculo). Sin embargo, también son muy caros: generalmente, la compañía vende “versiones para estudiantes” (versiones lisiadas de lo real) a muy bajo costo; venden “versiones educativas” de pleno poder a un precio que me hace estremecer; y venden licencias comerciales con un precio asombrosamente alto. El modelo de negocio aquí es aspirarte durante tus días de estudiante, y luego dejarte dependiente de sus herramientas cuando sales al mundo real. Es difícil culparlos por intentarlo, pero personalmente no estoy a favor de desembolsar miles de dólares si puedo evitarlo. Y puedes evitarlo: si haces uso de paquetes como R que son de código abierto y gratuitos, nunca te quedas atrapado teniendo que pagar tarifas de licencia exorbitantes.
• Algo que quizás no aprecies ahora, pero que te encantará más adelante si haces algo que implique el análisis de datos, es el hecho de que R es altamente extensible. Cuando descargas e instalas R, obtienes todos los “paquetes” básicos, y esos son muy potentes por sí solos. Sin embargo, debido a que R es tan abierto y tan ampliamente utilizado, se ha convertido en una especie de herramienta estándar en estadística, y así mucha gente escribe sus propios paquetes que extienden el sistema. Y estos también están disponibles gratuitamente. Una de las consecuencias de esto, me he dado cuenta, es que si abres un libro de texto avanzado (uno reciente, es decir) en lugar de libros de texto introductorios, es que muchos de ellos usan R. En otras palabras, si aprendes a hacer tus estadísticas básicas en R, entonces estás mucho más cerca de poder usar los métodos de última generación de lo que sería si hubiera comenzado con un sistema “más simple”: así que si quieres convertirte en un auténtico experto en análisis de datos psicológicos, aprender R es un muy buen uso de tu tiempo.
• Relacionado con el punto anterior: R es un lenguaje de programación real. A medida que mejora en el uso de R para el análisis de datos, también está aprendiendo a programar. Para algunas personas esto puede parecer algo malo, pero en verdad, la programación es una habilidad fundamental de investigación en muchas de las ciencias sociales y del comportamiento. Piense en cuántas encuestas y experimentos se realizan en línea, o se presentan en computadoras. Piense en todos esos entornos sociales en línea que podría interesarle estudiar; y tal vez recopilar datos de manera automatizada. Piense en sistemas de inteligencia artificial, visión por computador y reconocimiento de voz. Si alguna de estas son cosas en las que crees que podrías querer involucrarte —como alguien que “investiga en psicología”, es decir— necesitarás saber un poco de programación. Y si aún no sabes programar, entonces aprender a hacer estadísticas usando R es una buena manera de comenzar.

Esas son las principales razones por las que uso R. No está exenta de defectos: no es fácil de aprender, y tiene algunas peculiaridades muy molestas con las que todos estamos prácticamente atrapados, pero en general creo que las fortalezas superan a la debilidad; más que cualquier otra opción que haya encontrado hasta ahora.

This page titled 3: Empezando con R is shared under a CC BY-SA 4.0 license and was authored, remixed, and/or curated by Danielle Navarro via source content that was edited to the style and standards of the LibreTexts platform.