Tutorial instalación R y RStudio


⚠️ UPDATE MAYO-2020:
Subí una nueva versión de este post, actualizada al 2020, acá 👉 Tutorial de instalación de R y RStudio (2020)


Este tutorial tiene como propósito hacer el set-up inicial para empezar a desarrollar modelos machine learning en el increíble lenguaje R.

Empecemos!

Instalando R

Pueden ir a la página principal: https://cran.r-project.org, o bien alos atajos debajo.
Los llevará a la última versión de R: 3.5.3 (abril 2019):

Windows

https://cran.r-project.org/bin/windows/base/old/3.5.3/R-3.5.3-win.exe

En algunos casos será necesario instalar Rtools, el que trae programas para compilar como el gcc. Si sos desarrollador/a probablemente ya lo tengas.

Rtools lo bajan de: https://cran.r-project.org/bin/windows/Rtools/Rtools34.exe

Al instalar tengan la precaución de setear la opcion del PATH como figura en la imagen:

Mas información de Rtools acá: https://github.com/stan-dev/rstan/wiki/Install-Rtools-for-Windows

MacOS

http://mirror.fcaglp.unlp.edu.ar/CRAN/bin/macosx/R-3.5.3.pkg

Linux

http://mirror.fcaglp.unlp.edu.ar/CRAN/ (elijan su distribución)

Instalando RStudio

Es el entorno de desarrollo de R.

Vamos a: https://www.rstudio.com/products/rstudio/download/#download

Buscamos e instalamos la versión compatible con nuestro sistema operativo:

Instalando los paquetes (librerías) de R

Esto es dependiente de lo que se necesite hacer, pero daré los que uso normalmente.

Tengan en cuenta que si ya tenian R instalado, e instalan una version nueva, entonces necesitaran instalar todos los paquetes de nuevo.

Abren RStudio, y si todo fue bien, tienen que ver algo como esto:

A continuación copian y pegan la siguiente línea de código para instalar los paquetes en la consola (donde esta el cursor), apretan enter y esperan unos minutos…

libs_para_instalar=c( "tidyverse","Hmisc", "funModeling","reshape2" ,"caret", "data.table","lubridate", "zoo", "knitr","infotheo","RColorBrewer","minerva", "roxygen2","Lock5Data", "shiny", "scales","corrplot","feather", "gridExtra", "xgboost", "gbm", "randomForest", "devtools")

install.packages(libs_para_instalar)

Si les aparece el mensaje: "Do you want to install from sources the package which needs compilation? (Yes/no/cancel)" Escriban: Yes

Si les aparece que para instalar el paquete 'X' se necesita el paquete 'Y'. Instalen 'Y' y luego repitan el proceso.

Listo!

Verificando todos los paquetes instalados

Ejecuten la siguiente línea, que comparará los paquetes instalados con los que figuraban en la lista libs_para_instalar:

libs_para_instalar[!(libs_para_instalar %in% installed.packages()[,"Package"])]

Si todo salió bien no deberían ver reportado ningún paquete:

Nota: character(0) = todo salió ok

Errores durante la instalación

Revisen que no haya ningún error en la instalación al terminar.

Si lo hay, intenten reinstalar ese paquete solamente. Si no funciona -> Google (los errores pueden ser variados, sobretodo si tienen windows).

Si siguen con el problema, pueden preguntarlo en español en: datosenR.org

Si tuvieron un error en la instalación de un paquete, todos los paquetes siguientes en la lista no fueron instalados. Pueden probar el volver a correr el install.packages, solamente con los paquetes en cuestión.

Si ya tienen la distribución de R de Microsoft, MRAN (https://mran.microsoft.com); es muy problable que los paquetes que instalen no estén a la última versión que en CRAN.

¿Qué es CRAN? Es la red global de servidores oficiales de R donde están los paquetes y el programa R en cuestión. Cada vez que hacen install.packages los va a buscar ahí.

Les recomiendo que igualmente instalen R desde CRAN (como lo indicado anteriormente).

Como resolver el warning: "package 'xxx' is not available (for R version x.y.z)?

Haciendo algunas pruebas

Copien y ejecuten esto en R, crearan unos gráficos y creando un modelo predictivo, así de fácil!

library(randomForest) 
library(tidyverse) 
library(funModeling) 

randomForest(mtcars, formula = wt ~ qsec)

select(mtcars, cyl, hp) %>% arrange(cyl) %>% top_n(5)

ggplot(mtcars, aes(cyl)) + geom_histogram()

plot_num(mtcars)

Fin 🎉


Si quieren seguir practicando ciencia de datos, los/las invito a leer: https://librovivodecienciadedatos.ai 📗

Happy coding! 🚀

Twitter y Linkedin.