/ rstats

Tutorial instalación R y RStudio

Este tutorial tiene como propósito hacer el set-up inicial para empezar a desarrollar modelos machine learning en el increíble lenguaje R.

Instalando R

Pagina principal: https://cran.r-project.org

Abajo unos atajos a las descargas de la última versión de R (3.5.1):

Windows

http://mirror.fcaglp.unlp.edu.ar/CRAN/bin/windows/base/R-3.5.1-win.exe

En algunos casos será necesario instalar Rtools, el que trae programas para compilar como el gcc. Si sos desarrollador problablemente ya lo tengas.

Rtools lo bajan de: https://cran.r-project.org/bin/windows/Rtools/Rtools34.exe

Al instalar tengan la precaución de setear la opcion del PATH como figura en la imagen:

Mas información de Rtools acá: https://github.com/stan-dev/rstan/wiki/Install-Rtools-for-Windows

MacOS

http://mirror.fcaglp.unlp.edu.ar/CRAN/bin/macosx/R-3.5.1.pkg

Linux

http://mirror.fcaglp.unlp.edu.ar/CRAN/ (elijan su distribución)
Instalando RStudio

Es el entorno de desarrollo de R.

Vamos a: https://www.rstudio.com/products/rstudio/download/#download

Y buscamos la versión compatible con nuestro sistema operativo:

Bajamos la correcta e instalamos!

Instalando los paquetes (librerías) de R

Esto es dependiente de lo que se necesite hacer, pero daré los que uso normalmente.

Tengan en cuenta que si ya tenian R instalado, e instalan una version nueva, entonces necesitaran instalar todos los paquetes de nuevo.

Abren Rstudio, y si todo fue bien, tienen que ver algo como esto:

A continuación copian y pegan la siguiente línea de código para instalar los paquetes en la consola (donde esta el cursor), apretan enter y esperan unos minutos…

libs_para_instalar=c( "tidyverse","Hmisc", "funModeling","reshape2" ,"caret", "data.table","lubridate", "zoo", "knitr","infotheo","RColorBrewer","minerva", "roxygen2","Lock5Data", "shiny", "scales","corrplot","feather", "gridExtra", "xgboost", "gbm", "randomForest", "devtools")

install.packages(libs_para_instalar)

Si les aparece el mensaje: “Do you want to install from sources the package which needs compilation? (Yes/no/cancel)” — Escriban: Yes

Si les aparece que para instalar el paquete 'X' se necesita el paquete 'Y'. Instalen 'Y' y luego repitan el proceso.

Listo!

Verificando todos los paquetes instalados

Ejecuten la siguiente línea, que comparará los paquetes instalados con los que figuraban en la lista libs_para_instalar:

libs_para_instalar[!(libs_para_instalar %in% installed.packages()[,"Package"])]

Si todo salió bien no deberían ver reportado ningún paquete.

Errores durante la instalación

Revisen que no haya ningún error en la instalación al terminar.

Si lo hay, intenten reinstalar ese paquete solamente. Si no funciona -> Google (los errores pueden ser variados, sobretodo si tienen windows).

Si tuvieron un error en la instalación de un paquete, todos los paquetes siguientes en la lista no fueron instalados. Deben volver a correr el install.packages con los paquetes en cuestión.

Si ya tienen la distribución de R de Microsoft, MRAN (https://mran.microsoft.com); es muy problable que los paquetes que instalen no estén a la última versión que en CRAN.

¿Qué es CRAN? Es la red global de servidores oficiales de R donde están los paquetes y el programa R en cuestión. Cada vez que hacen install.packages los va a buscar ahí.

Les recomiendo que igualmente instalen R desde CRAN (como lo indicado anteriormente).

Como resolver el warning: "package 'xxx' is not available (for R version x.y.z)?

Haciendo algunas pruebas

Con esto crean un modelo predictivo, asi de facil!

randomForest::randomForest(mtcars, formula = wt ~ qsec)

Y algunos gráficos…

funModeling::plot_num(mtcars)

Finalizando

Los cursos o material para aprender Machine Learning con R (ó ciencia de datos) los iré anunciando en mi Twitter.

Si quieren seguir aprendiendo los invito a visitar el Blog y el libro open-source que publique (totalmente accesible): Data Science Live Book

Si bien no es introductorio de R, está lleno de ejemplos prácticos en análisis exploratorio, preparación de datos y validación de modelos machine learning.

Happy coding! 🚀

— -
Twitter @pabloc_ds

Pablo Casas

Pablo Casas

Data Analysis ~ The art of finding order in data by browsing its inner information.

Read More
Tutorial instalación R y RStudio
Share this