R vs Python

Tanto R como Python son los lenguajes más usados en el ámbito de Data Science. Aparte, R es un lenguaje más centrado a las matemáticas y la estadística, mientras que Python es un allroad. Hagamos un pequeño análisis de ambos!

¿De donde vienen?

R se creó en 1996 por los profesores de estadística Ross Ihaka y Robert Gentleman de la Universidad de Auckland en Nueva Zelanda.

El nombre surge de las iniciales de ambos creadores.

Python se creó en 1991 por Guido Van Rossum en el Centro para las Matemáticas y la Informática de Holanda (CWI, Centrum Wiskunde & Informatica).

El nombre surge de la afición de su creador por los británicos de Monty Python. El lenguaje está inspirado en varios lenguajes, entre los que se destaca de manera más destacada C. Hay que remarcar que Python es orientado a objetos.

¿Si estoy en la duda, cuál debo de usar?

Si uno de nuestros elementos más importantes es el tema de la visualización y los gráficos, R está muy por delante de Python. R ofrece gráficos sorprendentes mucho más sofisticados que los de Python, gracias a librerías como ggplot2.

Por otro lado, Python es más adecuado para implementar algoritmos de productividad. Gracias a la gran cantidad de paquetes que existen en el repositorio de Python, es realmente más fácil hacer algoritmos genéricos de manera más rápida y vincular flujos de trabajos o componentes de otros sistemas. R se puede utilizar como lenguaje de programación, pero ese no es su punto fuerte para nada.

Es importante remarcar que ambos lenguajes tienen un sistema de paquetes excelente, de tal manera que prácticamente cualquier cosa que se quiera hacer se puede simplificar mediante el uso de librerías, y de ahí una característica y fortaleza que tienen en común.

¿Cuál se utiliza hoy en día?

La industria está dividida entre estos dos lenguajes de cara a hacer análisis de datos, con otros lenguajes como Scala o Java mucho menos requeridos.

En mi opinión personal, tras mirar decenas de ofertas de trabajo, veo que lo más requerido es el conocimiento proficiente de Python, con el conocimiento de R como un plus muy importante. De esta manera, si eres Data Scientist, no conviene descuidar ninguno de los dos, puesto que el uso de ambos da lugar a un abanico más amplio de posibilidades en el desarrollo de los algoritmos para hacer análisis de datos.

Pon aquí tu comentario :D