Para aquellos que aún no están familiarizados con la R, empecemos con una rápida visión general. Para empezar, R es un lenguaje de programación fascinante, que recientemente se ha convertido en una habilidad atractiva para añadir a su currículum. Esto se debe en parte a que el lenguaje ha crecido significativamente en popularidad; ahora se utiliza en una gama de profesiones que incluyen el desarrollo de software, análisis de negocios, informes estadísticos e investigación científica. Es más probable que nunca que encuentres R en tu organización – e incluso es probable que encuentres razones para usarlo tú mismo.
Si necesita pruebas, no busque más que el crecimiento de R, que se refleja en varias listas independientes; ha rebotado en los 20 principales idiomas en el Índice Tiobe de Popularidad del Lenguaje de Programación durante los últimos años. En 2015, el IEEE incluyó a R en 6 de los 10 principales idiomas de 2015. Además, a medida que aumenta la cantidad de trabajo intensivo en datos, la demanda de herramientas como R para el procesamiento, la minería de datos y la visualización también aumentará.
R en el negocio
R se originó como una versión de código abierto del lenguaje de programación S en los 90. Desde entonces, se ha ganado el apoyo de varias empresas, entre las que destacan RStudio y Revolution Analytics, que crearon herramientas, paquetes y servicios relacionados con el lenguaje. Pero no se limita a estas empresas más especializadas; R también cuenta con el apoyo de grandes empresas que alimentan algunas de las bases de datos relacionales más grandes del mundo. Oracle, por ejemplo, ha incorporado R en sus ofertas. A principios de este año Microsoft adquirió Revolution Analytics y está incluyendo el lenguaje en SQLServer 2016. Los administradores de SQLServer y los desarrolladores de .NET ahora tienen R a su alcance, instalado con sus herramientas de plataforma estándar.
R en la educación superior
Aquí hay un dato curioso: la R se originó en el mundo académico. Ross Ihaka y Robert Gentleman de la Universidad de Auckland en Nueva Zelanda la crearon, y ha sido ampliamente adoptada en programas de postgrado que incluyen un estudio estadístico intensivo. R también se ha utilizado en cursos masivos abiertos en línea (MOOCs) como el Programa de Ciencia de Datos de Coursera y en cursos aquí en (incluyendo los míos en R y RStudio). La gente que toma estudios de postgrado que implican el crujido de datos están obligados a encontrar R, y como muchas otras tecnologías, su introducción en las escuelas conduce naturalmente a su más amplia adopción en la industria. La presencia de R en la educación superior es la confirmación de la demanda de estas habilidades en los entornos empresariales.
R es rentable
La tecnología es divertida, seguro, pero la mayoría de los que la disfrutamos también lo hacemos para ganarnos la vida. Afortunadamente, la R no sólo es un placer de usar, sino que su demanda en los negocios a menudo equivale a salarios más altos para sus practicantes. La Encuesta de Salarios de Tecnología de Dados realizada el año pasado clasificó a R como la habilidad mejor pagada. La más reciente Encuesta de Salarios de la Ciencia de Datos O$0027Reilly también incluye R entre las habilidades usadas por los científicos de datos mejor pagados.
R tiene una comunidad diversa
La comunidad R es diversa, con muchos individuos que provienen de entornos profesionales únicos. Esta lista incluye académicos, científicos, estadísticos, analistas de negocios y programadores profesionales, entre otros. CRAN, la completa Red de Archivos R, mantiene paquetes creados por miembros de la comunidad que reflejan este colorido fondo. Los paquetes existen para realizar análisis de mercado de valores, crear mapas, participar en análisis genómicos de alto rendimiento y hacer procesamiento de lenguaje natural. Esto es sólo la punta del iceberg; más de 7000 paquetes están disponibles en CRAN hasta el momento de escribir este artículo. Además, R-Bloggers es un sitio de agregación de blogs que sirve como centro de noticias relacionadas con la comunidad R.
R es divertido
Y, por supuesto, R es DIVERTIDO! Inicialmente, me sentí atraído por R por su capacidad de generar gráficos y diagramas en muy pocas líneas de código.; tareas que requerirían varios cientos de líneas de código en otro lenguaje podrían ser realizadas en sólo unas pocas líneas. Aunque se considera estrafalario cuando se compara con muchos lenguajes populares, incluye poderosas características específicamente orientadas al análisis de datos. Por ejemplo, si ejecutas el siguiente fragmento en el indicador R:
> plot(iris)
La siguiente trama está representada:
El fragmento resulta en las siguientes operaciones:
- El conjunto de datos del Iris es un conocido conjunto de datos incluido con R por defecto. No se requiere ninguna acción especial para cargarlo o incluirlo. El conjunto de datos consta de 150 registros con las medidas en centímetros de la longitud y anchura del sépalo y la longitud y anchura del pétalo, respectivamente, para 50 flores de cada una de las 3 especies de iris (setosa, versicolor y virginica). Es común que otros paquetes R incluyan conjuntos de datos para la prueba inicial de nuevas funcionalidades.
- La función plot() es muy adaptable. Toma los datos en una variedad de formas y responde con una gráfica razonable de los datos proporcionados. Puede tomar muchas opciones para influir en su comportamiento. En el caso que se muestra arriba, cada variable del conjunto de datos se traza contra cada una de las otras variables del conjunto de datos. El resultado es una matriz de gráficos de dispersión que dan una indicación de la distribución entre cada par de variables. Por ejemplo, a simple vista, se puede decir que la longitud del pétalo tiene más probabilidades de dar una indicación clara de a qué especie pertenece un registro determinado que la anchura del sépalo.
Una imagen puede valer más que mil palabras, pero sólo se necesitaron 10 caracteres en los lenguajes de programación R para crear este gráfico sorprendentemente expresivo.
R vale la pena aprender por estas razones y más. Su crecimiento y madurez han llevado a una adopción generalizada y a muchos recursos para el aprendizaje. Y ahora con el avance de Microsoft y la inclusión de R en más de sus ofertas, puedes esperar oír más sobre R en los meses y años venideros.