R es un lenguaje de programación, pero también un entorno de trabajo:
R presenta algunas peculiaridades ligadas a su origen. R fue creado inicialmente como soporte para el cĆ”lculo estadĆstico. Por ello, se considera a R un lenguaje difĆcil de entender para aquellos investigadores con experiencia en otros lenguajes de programación, pero tambiĆ©n es la razón por la que es una herramienta muy poderosa. El origen de R se remonta a los aƱos 90; dos investigadores neozelandeses, Ross Ihaka y Robert Gentleman, de la Universidad de Auckland, comenzaron en 1992 a diseƱar una implementación abierta y gratuita del lenguaje de programación S, propiedad de los Laboratorios Bell. Una versión inicial se ofreció en 1995 y ya en el 2000 existĆa una versión final estable. Por tanto, R hereda muchas caracterĆsticas de S. Por ejemplo, una de las mĆ”s sorprendentes es que frecuentemente existe mĆ”s de una manera de ejecutar una misma tarea, normalmente una compatible con S y otra diseƱada especĆficamente para R. Esta peculiaridad implica una sintaxis poco intuitiva que conduce a frustaciones durante el aprendizaje de R.
El R Development Core Team, un equipo de especialistas provenientes de diferentes instituciones y lugares alrededor del mundo, es el encargado del mantenimiento y desarrollo de R. La versión de R mantenida por este equipo es conocida como ābaseā, sobre la que se desarrollan mejoras asó como nuevos paquetes. R es un software libre y de código abierto, siendo distribuido de manera gratuita, a travĆ©s de la Licencia PĆŗblica General de GNU. Por ello, se puede examinar su código, asĆ como crear versiones propias āad hocā, asĆ como usar R para diferentes fines (personales, acadĆ©micos, comerciales), sin limitaciones.
A diferencia de muchos programas en entorno windows, R carece de botones para ejecutar órdenes. El usuario se comunica directamente con el software mediante un lenguaje especĆfico (código). En la era de Windows, ĀæquĆ© ventajas aporta R?:
Replicabilidad: cualquier persona a quien enviemos nuestro código podrÔ entender qué hemos realizado y replicarlo de manera exacta. Cada vez es mÔs habitual que las revistas académicas exijan los archivos de sintaxis para la publicación de resultados.
Eficiencia: a la larga, el uso de sintaxis ahorra tiempo cuando se repiten los procedimientos, o cuando se encadenan varios procedimientos secuencialmente.
Control: el usuario controla todas las fases de su trabajo, pudiendo simplificar o añadir complejidad a su conveniencia. AdemÔs, facilita la detección de errores y potencia el trabajo colaborativo, ya que diferentes investigadores(as) comparten el mismo lenguaje.
Flexibilidad. R incorpora paquetes adicionales a su versión bĆ”sica, que posibilitan la aplicación de una gran variedad de tĆ©cnicas de procesamiento de datos, anĆ”lisis estadĆstico e incluso geoespacial, asĆ como el uso de diferentes fuentes de información (por ejemplo, datos existentes en la web). Si bien programas como Microsoft Excel o SPSS cuentan con las herramientas para un anĆ”lisis estadĆstico bĆ”sico, para otras mĆ”s sofisticadas resultan limitadas.
Costo. R es un software libre que cuya distribución y uso es gratuita; sus usuarios son libres de copiarlo, distribuirlo, editarlo y modificarlo segĆŗn sus propias necesidades. El valor del software libre tambiĆ©n se sustenta en una gran transparencia en cuanto al diseƱo de sus diferentes funcionalidades. Esto permite que lo realizado no sea una ācaja negraā, lo que es importante para su uso en investigación cientĆfica, proceso en el cual se busca tener un control de los anĆ”lisis realizados. Microsoft Excel, SPSS y Stata requieren la adquisición de una licencia de pago, cuyo costo puede incrementarse si se requiere paquetes de anĆ”lisis mĆ”s sofisticados.
Facilidad de uso. Una de las principales caracterĆsticas del software comercial es su facilidad de uso. Son softwares amigables, que ponen a disposición del usuario una amplia variedad de herramientas de uso intuitivo. Por otra parte, Python y R presentan una interfaz de mayor complejidad. Tal dificultad implica una curva de aprendizaje mĆ”s lenta que se compensa con las ventajas ya seƱaladas en relación a los criterios de costo y generalidad.
Desarrollo y actualización. R es una plataformas en continuo desarrollo y actualización, que se sustenta en una comunidad cientĆfica activa e involucrada en la producción de nuevas herramientas y soluciones. Si bien existen otras alternativas de softwares altamente especializados en tĆ©cnicas especĆficas de anĆ”lisis de datos (sea de anĆ”lisis cuantitativo o cualitativo) Ć©stas tienden a quedar desactualizadas una vez pierden popularidad y su negocio deja de ser rentable.
Curva de aprendizaje en R
La siguiente tabla resume de forma comparada los atributos y caracterĆsticas de algunos softwares analizados.
Dimensión / Lenguaje | R | Python | SPSS | Excel | Stata |
---|---|---|---|---|---|
Alcance | General, orientación multidisciplinar | General, orientación multidisciplinar | Limitado, orientado a Ciencias Sociales | Limitado, orientado a administración | Limitado, orientado a EconomĆa |
Licencia | Libre (freeware) | Libre (freeware) | Pago (versión de prueba limitada) | Pago (versión de prueba limitada) | Pago (versión de prueba limitada) |
Aprendizaje | Sintaxis, poco intuitivo | Sintaxis, poco intuitivo | Botones y sintaxis, intuitivo | Botones y sintaxis, intuitivo | Botones y sintaxis, intuitivo |
Visualización | Avanzada | Intermedia | BÔsica | Intermedia | Intermedia |
AnƔlisis de texto | Intermedio, poca eficiencia | Avanzado, amplia eficiencia | No | No | No |
MinerĆa Datos | Intermedia, poca eficiencia | Avanzado, amplia eficiencia | No | No | No |
Sistema operativo | Windows, Mac OS, Linux | Windows, Mac OS, Linux | Windows, Mac OS | Windows, Mac OS | Windows, Mac OS |
La instalación de R sigue pasos diferentes dependiendo del sistema operativo utilizado, pero requieren el uso de CRAN, acrónimo de The Comprehensive R Archive Network, una red en la que se archivan todas las versiones bĆ”sicas de R, asĆ como los paquetes que han pasado una rigurosa revisión por el CRAN Team, encargado de asegurar su correcto funcionamiento. CRAN es una red que mantiene copias de su contenido en diferentes servidores alrededor del mundo, en continua actualización. Por ello, no importa de quĆ© servidor de CRAN se descargue el paquete base u otro, ya que siempre se obtiene la versión mĆ”s reciente. Sólo en ocasiones, algĆŗn paquete de R podrĆan ser descargados de servidores ajenos a CRAN. El sitio oficial de CRAN es el siguiente: https://cran.r-project.org/
Dado que la mayorĆa de los usuarios de R trabajan en un entorno
Windows, la versión mÔs reciente de R se puede descargar desde el
siguiente enlace de CRAN: https://cran.r-project.org/bin/windows/base/
Esta versión consiste en un archivo ejecutable (extensión *.exe, por ejemplo R-3.5.1-win.exe) que debe instalarse en el disco duro duro. Una vez descargado, deberĆ” ser abierto, seleccionando el idioma preferido y haciendo clic en āSiguienteā en todos los cuadros de diĆ”logo.
Paso 1 de la instalación de R
En el siguiente paso se seleccionarÔ la ruta del directorio dónde se debe instalar R.
Paso 2 de la instalación de R
A continuación, se pueden seleccionar la versión (32 o 64 bits).
Paso 3 de de la instalación de R
También se pueden personalizar algunas opciones de configuración.
Una vez finalizada la instalación, se podrĆa utilizar la plataforma R base en Windows.
R puede ser usado directamente, mediante un sencillo intefaz, pero lo mÔs habitual es el uso de un entorno integrado de desarrollo (IDE, por sus siglas en inglés). Un IDE es una herramienta para escribir y revisar códigos, administrar los archivos en uso y gestionar el entorno de trabajo, amén de otras herramientas. Aunque existen varias opciones de IDE para R (por ejemplo, RCommander), usaremos RStudio. Este entorno, que incorpora las funciones esenciales de una IDE, ha contribuido a un manejo mÔs fÔcil del programa.
Para instalar RStudio debemos repetir los pasos seguidos en el caso de la descarga de R base, desde la pÔgina web de RStudio https://posit.co/download/rstudio-desktop/. Como en el caso anterior, se descarga un archivo ejecutable que instalaremos en nuestro disco duro y luego ejecutaremos. Si ya se ha instalado previamente R en nuestro equipo, RStudio lo detectarÔ automÔticamente y se podrÔ utilizar desde este entorno. Si no hubiéramos instalado R, cada vez que iniciamos RStudio, verificarÔ la instalación de R.
Paso 1 de la instalación de RStudio
Paso 2 de la instalación de RStudio