Programación en R para ciencia: fundamentos

Compartir en redes sociales

Docente: Ezequiel Toum (Dr. en Ingeniería – Ingeniero Civil, IANIGLA-CONICET)

Duración: 75h reloj

Fecha de pre-inscripción: hasta el 14 de febrero

Fecha de realización: 10 al 21 de marzo

Fecha de inscripción: del 17 de febrero al 05 de marzo

Modalidad: híbrida (presencial y presencial mediado por tecnologías)

Días y horarios: Primera semana presencial. Lunes a viernes de 9:00 a 13:00 hs y de 14:00 a 16:30 hs. Segunda semana sincrónica mediada por tecnología. Lunes a jueves de 9:00 a 13:00 hs y de 14:00 a 16:30 hs. Viernes de 9:00 a 10:30 hs

Cupo máximo: 25 alumnos.

Requisitos mínimos:
1. nivel básico de R. El postulante debe saber instalar R, RStudio y paquetes.
2. realizar trabajos relacionados con la investigación científica.

Resumen
La programación tiene un rol preponderante en el desarrollo del mundo moderno y por ende en
la ciencia (Wickham y Grolemund 2023; Downey 2024). Para esta última, el acceso masivo a
bases de datos libres a través de internet permite abordar investigaciones que eran
impensadas hace 20 años atrás, pero también demandan nuevas habilidades por parte la
comunidad científica y una de ellas es la programación (Slater et al. 2019; Donoho 2017). En
este curso se propone abordar el aprendizaje de la programación orientada al quehacer
científico desde una perspectiva práctica, a través de un lenguaje dinámico, moderno y en
constante crecimiento como R (R Core Team 2024). Al finalizar el curso se espera que el
estudiante adquiera las habilidades necesarias para importar, transformar, visualizar y analizar
datos contenidos en tablas bidimensionales. Además, aprenderá los fundamentos necesarios
para poder seguir creciendo en el mundo de la programación de manera autodidacta.

Objetivos
Lograr que los estudiantes obtengan fundamentos sólidos en el manejo del lenguaje R para
hacer ciencia. Luego de este curso se espera que los alumnos puedan:
+ importar datos.
+ adecuar esta información para su análisis.
+ transformar tablas con datos bidimensionales.
+ visualizar esta información.
+ programar sus propias rutinas.

Programa
1. Visualización de datos con ggplot2: fundamentos del paquete. Creación de un gráfico
sencillo. Un recorrido por el concepto de aesthetics. Explorando geometrías. Qué son y cómo
se usan los facets. Transformaciones estadísticas y ajuste de posiciones. Sistemas de
coordenadas.
2. Fundamentos básicos: programación en R y breve comparación con otros lenguajes.
Asignación y jerarquía de variables. Uso de funciones. Lineamientos para un código legible.
Scripts y Rstudio.
3. Lectura y limpieza de tablas: uso de los paquetes readr y readxl para leer formatos de
archivos varios. Introducción a tibble. Reforma y expansión de tablas, división de celdas y
manejo de celdas sin datos con tidyr. Tablas anidadas.
4. Transformación de datos: introducción a los paquetes dplyr y magrittr. Manipulación de
tablas. Agrupamiento de datos y síntesis de resultados. Extracción y creación de variables.
Combinación de tablas.
5. Manipulación de ‘strings’ con el paquete stingr: fundamentos. Encontrar texto con
patrones. Anclas. Caracteres especiales. Repetición. Agrupamiento. Detección de patrones,
extracción de los mismos o reemplazo. División de ‘strings’. Uso de IA (inteligencia artificial)
para codificar expresiones regulares.
6. Creación y manipulación de fechas: clases para representar el paso del tiempo. Creación
de fechas y horas con lubridate. Componentes. Extensión temporal. Zonas horarias.
7. Bucles: uso de la sentencia for y while. Programación imperativa y funcional. Introducción al
paquete purr. Familia de funciones map con su aplicación en argumentos simples y múltiples.
Familia walk para guardar múltiples gráficos.

Modo de evaluación: proyecto individual comprendido por (1) un informe escrito donde se explicite la problemática a abordar, la metodología y resultados; (2) un script que permita la reproducción de los resultados.

Cronograma
Turno mañana: Clases teóricas
Turno tarde: Clases prácticas

Arancel: $ 76.300