Infografía
Descripción
Este curso surge en respuesta a las necesidades de capacitación en diferentes áreas de la Ciencia de Datos diagnosticadas por la Red de Ciencia de Datos para la Conservación de la Biodiversidad Mesoamericana (redbioma). Está dirigido a profesionales que se desempeñan en actividades relacionadas con la Conservación de la Biodiversidad, por lo que se encuentra enfocado en la solución de problemas y el desarrollo de conocimientos y habilidades en el diseño e implementación de modelos simples de Aprendizaje Automático (utilizando el lenguaje Python) aplicados a conjuntos de datos afines con las áreas profesionales de los participantes.
Horario y fecha de inicio
El curso se impartirá en dos grupos independientes en los siguientes horarios:
- Grupo #1: inicia el miércoles 10 de julio y se impartirá todos miércoles de 3:00 a 5:00pm (GMT-6) durante 8 semanas.
- Grupo #2: inicia el jueves 11 de julio y se impartirá todos los jueves de 6:00 - 8:00pm (GMT-6) durante 8 semanas.
Tipo de curso
- Modalidad: Virtual, 8 sesiones sincrónicas semanales.
- Teórico/Práctico: Para completar el programa, es necesario tener una asistencia efectiva de más del 75% de las clases sincrónicas virtuales, y sus evaluaciones con un promedio mayor o igual a 70.
- Costo: Gratuito.
- Tener disponibilidad de al menos 16 horas durante todo el programa para asistir a ocho sesiones sincrónicas virtuales de clases. (2hrs / clase)
- Tener disponibilidad de al menos 24 horas durante todo el programa para realizar tareas cortas, los laboratorios prácticos del curso y un proyecto final. (3hrs / semana)
- Conocimientos básicos del lenguaje de programación Python, bibliotecas Numpy y Pandas para el manejo de datos y generalidades de la representación de datos geoespaciales. De preferencia haber aprobado el curso de Introducción a Python para Ciencia de Datos, que se ofrece como parte de este Programa de Capacitación.
- Llenar el formulario para Participar en las actividades de la redbioma. (anteriormente circulado, por favor llenarlo una sola vez)
Formulario de inscripción (Cupos limitados)
Enlace: Inscripciones Aprendizaje Automático Aplicado a Datos de Biodiversidad
Objetivos
General
Específicos
- Construir una comprensión sólida de los conceptos básicos, ciclo del desarrollo del aprendizaje automático, técnicas de visualización, así como el rol de los datos en dicho proceso que le permita al estudiante identificar el conjunto de habilidades de aprendizaje automático requeridas para su desarrollo profesional presente y futuro.
- Identificar el tipo de aprendizaje automático apropiado para cada tipo de problema.
- Construir modelos simples basados en una selección de técnicas de aprendizaje supervisado, no supervisado, semi supervisado, y aprendizaje profundo pertinentes a la Conservación de la Biodiversidad.
Metodología del curso
El programa del curso es teórico/práctico donde los participantes pondrán en práctica los conocimientos teóricos mediante casos de estudios, discusiones grupales, laboratorios y proyecto de investigación.
Importante:
- Todas las sesiones sincrónicas serán grabadas y publicadas en el sitio web del proyecto.
- Los proyectos finales de investigación serán publicados en el sitio web del proyecto.
Contenidos del programa
- Fundamentos de Aprendizaje automático
- Breve reseña histórica (timeline, de donde venimos y hacia donde vamos).
- Definiciones básicas.
- Fundamentos teóricos.[1]
- Ciclo del AA: diseño, implementación, evaluación, interpretación de resultados y puesta en producción. [2]
- Rol de los datos: tipos de datos, preparación.
- No/Low code IA, IA generativa.
- Enfoques de Aprendizaje automático
- Tipos de problemas.
- Tipos de aprendizaje automático.
- Criterios de selección de técnicas y comparación de resultados.
- Consideraciones sobre el diseño de colecciones de datos según los tipos de aprendizaje automático.
- Aprendizaje supervisado
- Descripción de técnicas de aprendizaje automático supervisado.
- Construcción de modelos simples basados en técnicas de aprendizaje supervisado pertinentes a la Conservación de la Biodiversidad.
- Aprendizaje no supervisado
- Descripción de técnicas de aprendizaje automático no supervisado.
- Construcción de modelos simples basados en técnicas de aprendizaje no supervisado pertinentes a la Conservación de la Biodiversidad.
- Aprendizaje semi supervisado.
- Descripción de técnicas de aprendizaje automático semi supervisado.
- Construcción de modelos simples basados en técnicas de aprendizaje semi supervisado pertinentes a la Conservación de la Biodiversidad.
- Aprendizaje profundo.
- Descripción de técnicas de aprendizaje automático profundo.
- Construcción de modelos simples basados en técnicas de aprendizaje profundo pertinentes a la Conservación de la Biodiversidad. [3,4]
- Reflexiones finales
- Retos y riesgos del aprendizaje automático. [5]
- Oportunidades de aplicación en el área de la Conservación de la Biodiversidad.
Evaluación
Rubro | Valor (%) |
---|---|
Tareas cortas | 30 |
Laboratorios | 40 |
Proyecto final | 30 |
Total | 100 |
Cada evaluación tendrá una fecha de entrega previamente establecida. La hora límite de las entregas será a las 23:45 GMT-6. No se reciben entregas tardías. El medio de entrega será la plataforma Google Classroom.
Cronograma de clases
Clase | Semana |
---|---|
Fundamentos de Aprendizaje automático | 1 |
Enfoques de Aprendizaje automático | 2 |
Aprendizaje supervisado | 3 |
Aprendizaje no supervisado | 4 |
Aprendizaje semi supervisado | 5 |
Aprendizaje por reforzamiento | 5 |
Aprendizaje profundo | 6-8 |
Reflexiones finales | 8 |
Presentación de proyectos | 8 |
Materiales
Se recomienda estudiar previo al curso los siguientes tutoriales:
Referencias
1. Greener, J.G., et al., A guide to machine learning for biologists. Nature reviews Molecular cell biology, 2022. 23(1): p. 40-55.
2. Guralnick, R., et al., Humans in the loop: Community science and machine learning synergies for overcoming herbarium digitization bottlenecks. Applications in Plant Sciences, 2024.12(1): p. e11560.
3. Triki, A., B. Bouaziz, and W. Mahdi, A deep learning-based approach for detecting plant organs from digitized herbarium specimen images. Ecological Informatics, 2022. 69: p. 101590.
4. Weaver, W.N. and S.A. Smith, From leaves to labels: Building modular machine learning networks for rapid herbarium specimen analysis with LeafMachine2. Applications in Plant Sciences, 2023. 11(5): p. e11548.
5. Sworna, Z.T., et al., The ethical implications of Chatbot developments for conservation expertise. AI and Ethics, 2024: p. 1-10.
Contactos
Persona facilitadora | Correo electrónico |
---|---|
Instructora: Emilia Zeledón Lostalo | emilia.zeledon@gmail.com |
María Auxiliadora Mora | maria.mora@itcr.ac.cr |