1 ĀæQUƉ ES R Y PARA QUE ES USADO?

1.1 Un lenguaje de programación y un entorno de trabajo.

R es un lenguaje de programación, pero también un entorno de trabajo:

  • Es un lenguaje de programación porque, a travĆ©s de instrucciones precisas (un código), realiza tareas especĆ­ficas.
  • Es un entorno de trabajo porque incluye un intĆ©rprete de esos códigos.

R presenta algunas peculiaridades ligadas a su origen. R fue creado inicialmente como soporte para el cÔlculo estadístico. Por ello, se considera a R un lenguaje difícil de entender para aquellos investigadores con experiencia en otros lenguajes de programación, pero también es la razón por la que es una herramienta muy poderosa. El origen de R se remonta a los años 90; dos investigadores neozelandeses, Ross Ihaka y Robert Gentleman, de la Universidad de Auckland, comenzaron en 1992 a diseñar una implementación abierta y gratuita del lenguaje de programación S, propiedad de los Laboratorios Bell. Una versión inicial se ofreció en 1995 y ya en el 2000 existía una versión final estable. Por tanto, R hereda muchas características de S. Por ejemplo, una de las mÔs sorprendentes es que frecuentemente existe mÔs de una manera de ejecutar una misma tarea, normalmente una compatible con S y otra diseñada específicamente para R. Esta peculiaridad implica una sintaxis poco intuitiva que conduce a frustaciones durante el aprendizaje de R.

El R Development Core Team, un equipo de especialistas provenientes de diferentes instituciones y lugares alrededor del mundo, es el encargado del mantenimiento y desarrollo de R. La versión de R mantenida por este equipo es conocida como ā€œbaseā€, sobre la que se desarrollan mejoras asó como nuevos paquetes. R es un software libre y de código abierto, siendo distribuido de manera gratuita, a travĆ©s de la Licencia PĆŗblica General de GNU. Por ello, se puede examinar su código, asĆ­ como crear versiones propias ā€œad hocā€, asĆ­ como usar R para diferentes fines (personales, acadĆ©micos, comerciales), sin limitaciones.

1.2 Ventajas e incovenientes del uso de R

A diferencia de muchos programas en entorno windows, R carece de botones para ejecutar órdenes. El usuario se comunica directamente con el software mediante un lenguaje específico (código). En la era de Windows, ¿qué ventajas aporta R?:

  • Replicabilidad: cualquier persona a quien enviemos nuestro código podrĆ” entender quĆ© hemos realizado y replicarlo de manera exacta. Cada vez es mĆ”s habitual que las revistas acadĆ©micas exijan los archivos de sintaxis para la publicación de resultados.

  • Eficiencia: a la larga, el uso de sintaxis ahorra tiempo cuando se repiten los procedimientos, o cuando se encadenan varios procedimientos secuencialmente.

  • Control: el usuario controla todas las fases de su trabajo, pudiendo simplificar o aƱadir complejidad a su conveniencia. AdemĆ”s, facilita la detección de errores y potencia el trabajo colaborativo, ya que diferentes investigadores(as) comparten el mismo lenguaje.

  • Flexibilidad. R incorpora paquetes adicionales a su versión bĆ”sica, que posibilitan la aplicación de una gran variedad de tĆ©cnicas de procesamiento de datos, anĆ”lisis estadĆ­stico e incluso geoespacial, asĆ­ como el uso de diferentes fuentes de información (por ejemplo, datos existentes en la web). Si bien programas como Microsoft Excel o SPSS cuentan con las herramientas para un anĆ”lisis estadĆ­stico bĆ”sico, para otras mĆ”s sofisticadas resultan limitadas.

  • Costo. R es un software libre que cuya distribución y uso es gratuita; sus usuarios son libres de copiarlo, distribuirlo, editarlo y modificarlo segĆŗn sus propias necesidades. El valor del software libre tambiĆ©n se sustenta en una gran transparencia en cuanto al diseƱo de sus diferentes funcionalidades. Esto permite que lo realizado no sea una ā€œcaja negraā€, lo que es importante para su uso en investigación cientĆ­fica, proceso en el cual se busca tener un control de los anĆ”lisis realizados. Microsoft Excel, SPSS y Stata requieren la adquisición de una licencia de pago, cuyo costo puede incrementarse si se requiere paquetes de anĆ”lisis mĆ”s sofisticados.

  • Facilidad de uso. Una de las principales caracterĆ­sticas del software comercial es su facilidad de uso. Son softwares amigables, que ponen a disposición del usuario una amplia variedad de herramientas de uso intuitivo. Por otra parte, Python y R presentan una interfaz de mayor complejidad. Tal dificultad implica una curva de aprendizaje mĆ”s lenta que se compensa con las ventajas ya seƱaladas en relación a los criterios de costo y generalidad.

  • Desarrollo y actualización. R es una plataformas en continuo desarrollo y actualización, que se sustenta en una comunidad cientĆ­fica activa e involucrada en la producción de nuevas herramientas y soluciones. Si bien existen otras alternativas de softwares altamente especializados en tĆ©cnicas especĆ­ficas de anĆ”lisis de datos (sea de anĆ”lisis cuantitativo o cualitativo) Ć©stas tienden a quedar desactualizadas una vez pierden popularidad y su negocio deja de ser rentable.

Curva de aprendizaje en R

La siguiente tabla resume de forma comparada los atributos y caracterĆ­sticas de algunos softwares analizados.

Dimensión / Lenguaje R Python SPSS Excel Stata
Alcance General, orientación multidisciplinar General, orientación multidisciplinar Limitado, orientado a Ciencias Sociales Limitado, orientado a administración Limitado, orientado a Economía
Licencia Libre (freeware) Libre (freeware) Pago (versión de prueba limitada) Pago (versión de prueba limitada) Pago (versión de prueba limitada)
Aprendizaje Sintaxis, poco intuitivo Sintaxis, poco intuitivo Botones y sintaxis, intuitivo Botones y sintaxis, intuitivo Botones y sintaxis, intuitivo
Visualización Avanzada Intermedia BÔsica Intermedia Intermedia
AnƔlisis de texto Intermedio, poca eficiencia Avanzado, amplia eficiencia No No No
MinerĆ­a Datos Intermedia, poca eficiencia Avanzado, amplia eficiencia No No No
Sistema operativo Windows, Mac OS, Linux Windows, Mac OS, Linux Windows, Mac OS Windows, Mac OS Windows, Mac OS

2 INSTALACIƓN

La instalación de R sigue pasos diferentes dependiendo del sistema operativo utilizado, pero requieren el uso de CRAN, acrónimo de The Comprehensive R Archive Network, una red en la que se archivan todas las versiones bÔsicas de R, así como los paquetes que han pasado una rigurosa revisión por el CRAN Team, encargado de asegurar su correcto funcionamiento. CRAN es una red que mantiene copias de su contenido en diferentes servidores alrededor del mundo, en continua actualización. Por ello, no importa de qué servidor de CRAN se descargue el paquete base u otro, ya que siempre se obtiene la versión mÔs reciente. Sólo en ocasiones, algún paquete de R podrían ser descargados de servidores ajenos a CRAN. El sitio oficial de CRAN es el siguiente: https://cran.r-project.org/

2.1 Instalación del paquete base de R

Dado que la mayoría de los usuarios de R trabajan en un entorno Windows, la versión mÔs reciente de R se puede descargar desde el siguiente enlace de CRAN: https://cran.r-project.org/bin/windows/base/

Esta versión consiste en un archivo ejecutable (extensión *.exe, por ejemplo R-3.5.1-win.exe) que debe instalarse en el disco duro duro. Una vez descargado, deberĆ” ser abierto, seleccionando el idioma preferido y haciendo clic en ā€œSiguienteā€ en todos los cuadros de diĆ”logo.

Paso 1 de la instalación de R

En el siguiente paso se seleccionarÔ la ruta del directorio dónde se debe instalar R.

Paso 2 de la instalación de R

A continuación, se pueden seleccionar la versión (32 o 64 bits).

Paso 3 de de la instalación de R

También se pueden personalizar algunas opciones de configuración.

Paso 4 de la instalación de R Imagen:

Una vez finalizada la instalación, se podría utilizar la plataforma R base en Windows.

2.2 Instalación de RStudio.

R puede ser usado directamente, mediante un sencillo intefaz, pero lo mÔs habitual es el uso de un entorno integrado de desarrollo (IDE, por sus siglas en inglés). Un IDE es una herramienta para escribir y revisar códigos, administrar los archivos en uso y gestionar el entorno de trabajo, amén de otras herramientas. Aunque existen varias opciones de IDE para R (por ejemplo, RCommander), usaremos RStudio. Este entorno, que incorpora las funciones esenciales de una IDE, ha contribuido a un manejo mÔs fÔcil del programa.

Para instalar RStudio debemos repetir los pasos seguidos en el caso de la descarga de R base, desde la pÔgina web de RStudio https://posit.co/download/rstudio-desktop/. Como en el caso anterior, se descarga un archivo ejecutable que instalaremos en nuestro disco duro y luego ejecutaremos. Si ya se ha instalado previamente R en nuestro equipo, RStudio lo detectarÔ automÔticamente y se podrÔ utilizar desde este entorno. Si no hubiéramos instalado R, cada vez que iniciamos RStudio, verificarÔ la instalación de R.

Paso 1 de la instalación de RStudio

Paso 2 de la instalación de RStudio