Infografía

Descripción

El curso está enfocado en introducir algunas de las herramientas básicas para hacer ciencia de datos usando el lenguaje R. Debido a que es un curso introductorio, también se revisarán algunos conceptos básicos del uso general del lenguaje R. Se espera que el curso brinde las bases para que los estudiantes puedan desarrollar sus propios proyectos enfocados en analizar datos de biodiversidad.

Horario y fecha de inicio
Importante: Se abrirá un único grupo en el horario que cuente con la mayor cantidad de participantes inscritos.
Horarios:
  • Grupo #1: Inicia el miércoles 09 de octubre y se impartirá todos los miércoles de 3:00 p.m. a 5:00 p.m. (GMT-6) durante 8 semanas.
  • Grupo #2: Inicia el miércoles 09 de octubre y se impartirá todos los miércoles de 6:00 p.m. a 8:00 p.m. (GMT-6) durante 8 semanas.

Tipo de curso
  • Modalidad: Virtual, 8 sesiones sincrónicas semanales.
  • Teórico/Práctico: Para completar el programa, es necesario tener una asistencia efectiva de más del 75% de las clases sincrónicas virtuales, y sus evaluaciones con un promedio mayor o igual a 70.
  • Costo: Gratuito.
Requisitos
  • Tener disponibilidad de al menos 16 horas durante todo el programa para asistir a ocho sesiones sincrónicas virtuales de clases. (2hrs / clase)
  • Tener disponibilidad de al menos 26 horas durante todo el programa para realizar tareas cortas, los laboratorios prácticos del curso y un proyecto final. (3hrs / semana)
  • Llenar el formulario para Participar en las actividades de la redbioma. (anteriormente circulado, por favor llenarlo una sola vez)

Formulario de inscripción (Cupos limitados)

Enlace: Inscripciones Lenguaje de Programación R

Objetivos

General

Desarrollar las habilidades de programación y de resolución de problemas con datos de biodiversidad, utilizando el lenguaje R. El curso ofrecerá las bases de programación en R y brindará herramientas para llevar a cabo distintas procesos relacionados con la ciencia de datos.

Específicos

  • Brindar las bases de la programación en R.
  • Proveer conocimientos sobre el uso de funciones y paquetes relevantes para el análisis de datos de biodiversidad.
  • Identificar estrategias para el uso de nuevos paquetes y funciones.

Metodología del curso

El curso estará basado en un aprendizaje activo por medio de la resolución de problemas. Por lo tanto, aunque el curso es teórico / práctico, su componente más extenso serán las prácticas. Se espera que estas muestren ejemplos de uso de ciertas funciones y que luego se utilicen estos conocimientos en un nuevo conjunto de prácticas en las tareas.

El programa del curso es teórico/práctico donde los participantes pondrán en práctica los conocimientos teóricos mediante casos de estudios, discusiones grupales, y un proyecto de investigación.

Importante:
  • Todas las sesiones sincrónicas serán grabadas y publicadas en el sitio web del proyecto.
  • Los proyectos finales de investigación serán publicados en el sitio web del proyecto.

Contenidos del programa

  1. Introducción a R, RStudio, programación (1 sesión de 2 horas).
    1. Bases de programación en R.
    2. Tipos de objetos.
  2. Manejo de datos (1 sesión de 2 horas).
    1. Flujo de trabajo en Ciencia de Datos.
    2. Paquetes.
    3. I/O datos.
  3. Acomodo de datos (1 sesión de 2 horas).
    1. Preprocesamiento con dplyr y tidyr.
  4. Análisis estadísticos (1 sesión de 2 horas).
    1. Análisis paramétricos y no paramétricos con rstatix.
  5. Gráficos (1 sesión de 2 horas).
    1. Gráficos personalizables con ggplot2.
  6. Métricas de diversidad (1 sesión de 2 horas).
    1. Índices de diversidad y curvas de acumulación de especies.
  7. Modelos (1 sesión de 2 horas).
    1. Entrenamiento y Evaluación de modelos con tidymodels.
  8. Cierre y descripción de trabajo final (1 sesión de 2 horas).
    1. Creación de reportes con Quarto.
    2. Recapitulación.

Evaluación

Las personas estudiantes llevarán a cabo tareas y un proyecto final, los rubros de las evaluaciones serán los siguientes:


Rubro Valor (%)
Clases presenciales 40
Tareas 30
Proyecto final 30
Total 100
El proyecto final consta de la aplicación de los conocimientos adquiridos en el curso a un problema de interés de cada estudiante.
Las tareas se dejarán después de cada clase y se podrán entregar hasta las 00:00 GMT-6 horas del día de la siguiente clase.

Cronograma de clases

Clase Tema
1 Introducción
2 Paquetes, I/O datos
3 Manejo de datos
4 Análisis estadísticos
5 Gráficos personalizables
6 Métricas de diversidad
7 Modelos
8 Creación de reportes y cierre

Materiales

Algunos de los materiales de apoyo son:

Referencias

  1. Wickham H., Çetinkaya-Rundel M., Grolemund G. 2023. R for Data Science: Import, Tidy, Transform, Visualize, and Model Data. 2nd Edition. link

  2. Wilke C.2019. Fundamentals of Data Visualization. 1st edition.link

  3. Kuhn M., Silge J. 2023. Tidy Modeling with R. link

  4. Roswell, M., Dushoff, J. and Winfree, R. (2021), A conceptual guide to measuring species diversity. Oikos, 130: 321-338. link

Contactos

Persona facilitadora Correo electrónico
Instructor: Jonathan Solórzano Villegas jonathanvsv@gmail.com
María Auxiliadora Mora maria.mora@itcr.ac.cr