Descripción

El presente curso está enfocado a introducir conceptos básicos de Ciencia de Datos a través del lenguaje de programación Python. A lo largo del curso, las personas estudiantes aprenderán la sintaxis y semántica necesaria del lenguaje para lograr un fundamento sólido de conocimientos que les ayudarán a realizar futuros proyectos en el área de aplicación.

Horario y fecha de inicio
El curso se impartirá en dos grupos independientes en los siguientes horarios:
  • Grupo #1: inicia el miércoles 24 de julio y se impartirá todos los miércoles a las 06:00 pm. (GMT-6) durante 8 semanas.
  • Grupo #2: inicia el jueves 25 de julio y se impartirá todos los jueves a las 03:00 pm. (GMT-6) durante 8 semanas.

Tipo de curso
  • Modalidad: Virtual.
  • Teórico/Práctico: Para completar el programa, es necesario tener una asistencia efectiva de más del 75% de las clases sincrónicas virtuales, y sus evaluaciones con un promedio mayor o igual a 70.
  • Costo: Gratuito.
Requisitos
  • Tener disponibilidad de al menos 16 horas durante todo el programa para asistir a ocho sesiones sincrónicas virtuales de clases. (2hrs / clase)
  • Tener disponibilidad de al menos 24 horas durante todo el programa para realizar tareas cortas, los laboratorios prácticos del curso y un proyecto final. (3hrs / semana)
  • Llenar el formulario para Participar en las actividades de la redbioma. (anteriormente circulado)

Formulario de inscripción (Cupos limitados)

Enlace: Inscripciones Python para Ciencia de Datos

Objetivos

General

Este programa de introducción a Python está diseñado para proporcionar una comprensión sólida de los conceptos básicos de la programación y los fundamentos de Python a través de lecciones teóricas y prácticas que permitan desarrollar capacidades en Ciencia de Datos en las personas participantes.

Específicos

  • Construir una comprensión sólida de la sintaxis básica de Python utilizada para escribir y ejecutar código en el lenguaje.
  • Experimentar con los conceptos básicos de programación, incluyendo variables, tipos de datos, estructuras de datos, funciones, programación orientada a objetos (POO), y graficación de datos.
  • Desarrollar conceptos relacionados con el tema de Ciencia de Datos, por ejemplo: álgebra lineal, aprendizaje automático, análisis exploratorio de datos, sistemas de información geográficos, entre otros.
  • Aplicar los conocimientos y habilidades adquiridos a través de laboratorios prácticos, para consolidar el aprendizaje y desarrollar habilidades en la programación de Python.
  • Desarrollar proyectos de investigación aplicados a la conservación de la biodiversidad.

Metodología del curso

La metodología del curso estará basada en aprendizaje activo y colaborativo, por medio de resolución de problemas planteados en los laboratorios, trabajo de investigación y aula invertida, entre otras técnicas. Se propone guiar a las personas estudiantes para que estas fortalezcan su capacidad de investigar y aplicar nuevos conceptos teniendo como base el conocimiento adquirido previamente y los contenidos del curso.

El programa del curso es teórico/práctico donde los participantes pondrán en práctica los conocimientos teóricos mediante casos de estudios, laboratorios y proyecto de investigación.

Importante:
  • Todas las sesiones sincrónicas serán grabadas y publicadas en el sitio web del proyecto.
  • Los proyectos finales de investigación serán publicados en el sitio web del proyecto.

Contenidos del programa

  1. Fundamentos de Python. (1 sesión / 2 horas)
    1. Introducción a Python.
    2. Configuración de ambiente de trabajo. (Cuadernos de Jupyter)
    3. Variables y tipos de datos.
    4. Estructuras de control de flujo.
    5. Funciones.
  2. Introducción al análisis de datos con Python. (4 sesiones / 2 horas)
    1. Introducción a POO y a Pandas.
    2. Manejo de datos y formatos de archivos.
    3. NumPy, matrices y vectores.
    4. Análisis exploratorio de datos.
    5. Graficación y visualización de datos.
    6. Transformación y preprocesamiento de datos.
  3. Introducción a la representación de datos geoespaciales. (1 sesión / 2 horas)
    1. Introducción a los sistemas de información geográfica (GIS) con datos de biodiversidad.
  4. Introducción al aprendizaje automático. (1 sesión / 2 horas)
    1. Introducción al aprendizaje automático.
    2. Ejemplo de uso.

Evaluación

Las personas estudiantes llevarán a cabo tareas cortas, laboratorios y un proyecto final, los rubros de las evaluaciones serán los siguientes:


Rubro Valor (%)
Tareas cortas 30
Laboratorios 40
Proyecto final 30
Total 100
Cada evaluación tendrá una fecha de entrega previamente establecida. La hora límite de las entregas será a las 23:45 GMT-6. No se reciben entregas tardías.

Cronograma de clases

Clase Semana
Fundamentos de Python 1
Introducción a POO y Pandas 2
NumPy, vectores y matrices 3
Análisis exploratorio de datos (EDA) 4
Preprocesamiento de datos 5
Sistemas de información geográfica 6
Inteligencia artificial (IA) 7
Presentación de proyectos 8

Materiales

Se recomienda estudiar previo al curso los siguientes tutoriales:

Contactos

Persona facilitadora Correo electrónico
María Auxiliadora Mora maria.mora@itcr.ac.cr
Josué Castro Ramírez jd.castro23r@gmail.com
Benjamin Johnson Davis eduardojohnson2001@gmail.com
Fabricio Ríos Montero fabrirm15@gmail.com
Alejandro Quesada Calderón ale11199@estudiantec.cr