Herramientas para el manejo de datos de biodiversidad en R

  • Inicia: 19/06/2023    Finaliza: 23/06/2023
  • Horario de clases: Lunes a viernes de 9 a 18 hrs con 20 minutos de descanso y una hora para comer
  • Estudiantes mínimo: 4    máximo: 26
  • Costo: $1,600
  • Creditos: 4
  • Horas: 40
  • Nota:
  • Coordinadores: Crisóforo Fabricio Villalobos Camacho
  • Profesores invitados: Gabriel Massaine Moulatlet
    Luis Darcy Verde Arregoitia
    Axel Arango García

Presentación

R es uno de los lenguajes más utilizados para el manejo, análisis, y visualización de datos. Esta herramienta Open Source cuenta con una gran cantidad de librerías para diferentes disciplinas científicas, por lo que un manejo adecuado de R es vital para quienes realizan investigación en biología y ecología. Este curso pretende familiarizar a los/las asistentes con las herramientas necesarias para manejar datos de biodiversidad y además corregir lagunas comunes en el manejo de R para usuarios de todos los niveles.

Objetivo

Presentar herramientas básicas y avanzadas para el mejor aprovechamiento del software R en estudios de biodiversidad.

Objetivos específicos

Los objetivos de este curso son que el alumno: 1. Conozca y asimile diferentes estrategias para manejar datos en R. 2. Conozca técnicas para realizar flujos de trabajo y análisis bien estructurados. 3. Conozca cómo manipular, limpiar y visualizar datos. 4. Aprenda rutinas poco comunes para aprovechar el software R al máximo.

Metodología

Pra?ctica: Aulas demostrativas y ejercicios pra?cticos?

Prerrequisitos del curso

Instalación local de R y preferente algún IDE (RStudio, VS Code, etc.). Poder instalar paquetes, manejar funciones básicas, y cargar datos desde archivos y fuentes remotas.

Habilidades y destrezas

Conocimiento básico de R, análisis de biodiversidad y datos asociados.

Criterios de calificación

Evaluacio?n de un trabajo individual o grupal (máximo 2 personas) en formato de nota de software, a entregarse una semana despue?s del curso.

Contenido temático

1) Flujos de trabajo y análisis:

– Organización de proyectos y archivos

– Buenas prácticas para nombrar archivos y objetos

– Trabajando con rutas

– Estructuras de datos

 

2) Manipulación y limpieza de datos

– Pasos a seguir para importar y reestructurar    tablas y archivos.

– Principios de datos ordenados (tidy data) y herramientas del ‘tidyverse’ para ordenar datos

– Expresiones regulares para trabajar con cadenas de texto

– Herramientas para trabajar con datos faltantes 

– Formas de identificar Información repetida

– Exploración rápida de datos

 

3) Visualización de Datos

– Introducción a ggplot2

– Representaciones gráficas de información

– Personalización de elementos gráficos (ejes, colores, fuentes, leyendas)

– Preparación de figuras científicas 

– Herramientas para exportar gráficos de alta resolución en múltiples formatos

 

4) Lo que nadie nos enseñó sobre R

– Entornos de trabajo y configuración

– Iteración y vectorización para evitar repetición

– Trabajando con listas

– Manejo de matrices (Gabriel)

– Atajos y herramientas para mayor eficiencia

– Significado de los errores más comunes

 

5) Aspectos de geografía de la biodiversidad

– Puntos, polígonos, rasters: nuevas paqueterías para manejo de datos espaciales

– Paquetes para generar mapas bivariados

– Trabajo con modelos de elevación digital

– Filogenias: manejo y visualización