Infografía

Texto alternativo

Descripción

La Inteligencia Artificial y en particular, la rama del Aprendizaje Automático ha tenido un crecimiento acelerado en los últimos años existiendo una gran diversidad de técnicas que pueden ser utilizadas en forma individual o en conjunto para analizar, extraer patrones y generar nuevos datos en innumerables áreas de aplicación, lo que ha permitido importantes avances en dichas disciplinas.

Este curso surge en respuesta a las necesidades de capacitación en diferentes áreas de la Ciencia de Datos diagnosticadas por la Red de Ciencia de Datos para la Conservación de la Biodiversidad Mesoamericana (redbioma). Está dirigido a profesionales que se desempeñan en actividades relacionadas con la Conservación de la Biodiversidad, por lo que se encuentra enfocado en la solución de problemas y el desarrollo de conocimientos y habilidades en el diseño e implementación de modelos simples de Aprendizaje Automático (utilizando el lenguaje Python) aplicados a conjuntos de datos afines con las áreas profesionales de los participantes.

Horario y fecha de inicio
El curso se impartirá en dos grupos independientes en los siguientes horarios:
  • Grupo #1: inicia el miércoles 10 de julio y se impartirá todos miércoles de 3:00 a 5:00pm (GMT-6) durante 8 semanas.
  • Grupo #2: inicia el jueves 11 de julio y se impartirá todos los jueves de 6:00 - 8:00pm (GMT-6) durante 8 semanas.

Tipo de curso
  • Modalidad: Virtual, 8 sesiones sincrónicas semanales.
  • Teórico/Práctico: Para completar el programa, es necesario tener una asistencia efectiva de más del 75% de las clases sincrónicas virtuales, y sus evaluaciones con un promedio mayor o igual a 70.
  • Costo: Gratuito.
Requisitos
  • Tener disponibilidad de al menos 16 horas durante todo el programa para asistir a ocho sesiones sincrónicas virtuales de clases. (2hrs / clase)
  • Tener disponibilidad de al menos 24 horas durante todo el programa para realizar tareas cortas, los laboratorios prácticos del curso y un proyecto final. (3hrs / semana)
  • Conocimientos básicos del lenguaje de programación Python, bibliotecas Numpy y Pandas para el manejo de datos y generalidades de la representación de datos geoespaciales. De preferencia haber aprobado el curso de Introducción a Python para Ciencia de Datos, que se ofrece como parte de este Programa de Capacitación.
  • Llenar el formulario para Participar en las actividades de la redbioma. (anteriormente circulado, por favor llenarlo una sola vez)

Formulario de inscripción (Cupos limitados)

Enlace: Inscripciones Aprendizaje Automático Aplicado a Datos de Biodiversidad

Objetivos

General

El desarrollo de habilidades de solución de problemas simples relacionados a la Conservación de la Biodiversidad utilizando técnicas de aprendizaje automático y la comprensión de esta rama de la Ciencia de Datos/Inteligencia Artificial y sus desafíos actuales.

Específicos

  • Construir una comprensión sólida de los conceptos básicos, ciclo del desarrollo del aprendizaje automático, técnicas de visualización, así como el rol de los datos en dicho proceso que le permita al estudiante identificar el conjunto de habilidades de aprendizaje automático requeridas para su desarrollo profesional presente y futuro.
  • Identificar el tipo de aprendizaje automático apropiado para cada tipo de problema.
  • Construir modelos simples basados en una selección de técnicas de aprendizaje supervisado, no supervisado, semi supervisado, y aprendizaje profundo pertinentes a la Conservación de la Biodiversidad.

Metodología del curso

La metodología del curso estará basada en aprendizaje activo y colaborativo, por medio de resolución de problemas planteados en los laboratorios, trabajo de investigación y aula invertida, entre otras técnicas. Se propone guiar a las personas estudiantes para que estas fortalezcan su capacidad de investigar, utilizar colecciones de datos públicas, analizar críticamente artículos científicos y aplicar nuevos conceptos teniendo como base el conocimiento adquirido previamente y los contenidos del curso.

El programa del curso es teórico/práctico donde los participantes pondrán en práctica los conocimientos teóricos mediante casos de estudios, discusiones grupales, laboratorios y proyecto de investigación.

Importante:
  • Todas las sesiones sincrónicas serán grabadas y publicadas en el sitio web del proyecto.
  • Los proyectos finales de investigación serán publicados en el sitio web del proyecto.

Contenidos del programa

  1. Fundamentos de Aprendizaje automático
    1. Breve reseña histórica (timeline, de donde venimos y hacia donde vamos).
    2. Definiciones básicas.
    3. Fundamentos teóricos.[1]
    4. Ciclo del AA: diseño, implementación, evaluación, interpretación de resultados y puesta en producción. [2]
    5. Rol de los datos: tipos de datos, preparación.
    6. No/Low code IA, IA generativa.
  2. Enfoques de Aprendizaje automático
    1. Tipos de problemas.
    2. Tipos de aprendizaje automático.
    3. Criterios de selección de técnicas y comparación de resultados.
    4. Consideraciones sobre el diseño de colecciones de datos según los tipos de aprendizaje automático.
  3. Aprendizaje supervisado
    1. Descripción de técnicas de aprendizaje automático supervisado.
    2. Construcción de modelos simples basados en técnicas de aprendizaje supervisado pertinentes a la Conservación de la Biodiversidad.
  4. Aprendizaje no supervisado
    1. Descripción de técnicas de aprendizaje automático no supervisado.
    2. Construcción de modelos simples basados en técnicas de aprendizaje no supervisado pertinentes a la Conservación de la Biodiversidad.
  5. Aprendizaje semi supervisado.
    1. Descripción de técnicas de aprendizaje automático semi supervisado.
    2. Construcción de modelos simples basados en técnicas de aprendizaje semi supervisado pertinentes a la Conservación de la Biodiversidad.
  6. Aprendizaje profundo.
    1. Descripción de técnicas de aprendizaje automático profundo.
    2. Construcción de modelos simples basados en técnicas de aprendizaje profundo pertinentes a la Conservación de la Biodiversidad. [3,4]
  7. Reflexiones finales
    1. Retos y riesgos del aprendizaje automático. [5]
    2. Oportunidades de aplicación en el área de la Conservación de la Biodiversidad.

Evaluación

Las personas estudiantes llevarán a cabo tareas cortas, laboratorios y un proyecto final, los rubros de las evaluaciones serán los siguientes:


Rubro Valor (%)
Tareas cortas 30
Laboratorios 40
Proyecto final 30
Total 100
El proyecto final consiste en identificar un caso de uso de aplicación del aprendizaje automático presente en el contexto profesional del participante.
Cada evaluación tendrá una fecha de entrega previamente establecida. La hora límite de las entregas será a las 23:45 GMT-6. No se reciben entregas tardías. El medio de entrega será la plataforma Google Classroom.

Cronograma de clases

Clase Semana
Fundamentos de Aprendizaje automático 1
Enfoques de Aprendizaje automático 2
Aprendizaje supervisado 3
Aprendizaje no supervisado 4
Aprendizaje semi supervisado 5
Aprendizaje por reforzamiento 5
Aprendizaje profundo 6-8
Reflexiones finales 8
Presentación de proyectos 8

Materiales

Se recomienda estudiar previo al curso los siguientes tutoriales:

Referencias

1. Greener, J.G., et al., A guide to machine learning for biologists. Nature reviews Molecular cell biology, 2022. 23(1): p. 40-55.

2. Guralnick, R., et al., Humans in the loop: Community science and machine learning synergies for overcoming herbarium digitization bottlenecks. Applications in Plant Sciences, 2024.12(1): p. e11560.

3. Triki, A., B. Bouaziz, and W. Mahdi, A deep learning-based approach for detecting plant organs from digitized herbarium specimen images. Ecological Informatics, 2022. 69: p. 101590.

4. Weaver, W.N. and S.A. Smith, From leaves to labels: Building modular machine learning networks for rapid herbarium specimen analysis with LeafMachine2. Applications in Plant Sciences, 2023. 11(5): p. e11548.

5. Sworna, Z.T., et al., The ethical implications of Chatbot developments for conservation expertise. AI and Ethics, 2024: p. 1-10.

Contactos

Persona facilitadora Correo electrónico
Instructora: Emilia Zeledón Lostalo emilia.zeledon@gmail.com
María Auxiliadora Mora maria.mora@itcr.ac.cr