Sistematización y movilización de datos biológicos: desde la colecta hasta el Big Data
Sistematización y movilización de datos biológicos: desde la colecta hasta el Big Data

  • Inicia: 31/03/2025    Finaliza: 11/04/2025
  • Modalidad: Presencial
  • Horario de clases: Lunes a Viernes de 9 a 17 horas. La actividad teórica será de 9 a 14 hrs., y la práctica de 14 a 17 hrs.
  • Estudiantes mínimo: 4    máximo: 15
  • Costo: $3,000
  • Creditos: 8
  • Horas: 80
  • Nota: Sede en Pátzcuaro
  • Coordinadores:
    Brenda Yudith Bedolla García
    Dr. Carlos Andrés Cultid Medina
  • Profesores invitados:
    Dra. Paola Andrea González Vanegas
    Dra. Patricia Hernández Ledesma
    Maestro Juan Martin Barrios Vargas
    M. en C. Jorge Mario Herrera Lopera

Hoy más que nunca, el estudio de la biodiversidad genera una masiva cantidad de información que proviene de diferentes fuentes (ej., estudios faunísticos, floras, código de barras de ADN -bardcoding-, ciencia ciudadana) y que se resguarda en una amplia variedad de formatos (ej., libretas, hojas de cálculo, bases de datos) y espacios (ej., Colecciones biológicas). Sin embargo, la crisis de la Biodiversidad no sólo se refleja en los efectos directos y negativos de la actividad humana sobre los ecosistemas, también se manifiesta en 1) grandes vacíos de información, 2) escasez de taxónomos y 3) limitaciones en el acceso y 4) visibilidad e implementación adecuada (ej., uso de estándares) de herramientas que permitan gestionar la información. Así, ante los retos que impone la vigente y acelerada transformación de los ecosistemas naturales, es necesario crear espacios académicos para fortalecer las bases conceptuales y prácticas para la gestión y movilización de datos asociados al estudio multiescalar (local, paisaje y región) y multinivel (especies, poblaciones y comunidades).

Este curso se enfocará en guiar a los asistentes en las técnicas de colecta, preservación y digitalización de especímenes (principalmente angiospermas y algunos grupos de insectos) para su incorporación en colecciones biológicas. En adición, se ofrecerán las pautas generales para que la información asociada a las colectas pueda ser movilizada a través de estándares internacionales y Ciencias Abierta, específicamente, para movilizar datos de biodiversidad en formato Darwin Core por medio de la plataforma del Sistema Global de Información (GBIF, por sus siglas en inglés). De forma complementaria, se revisará 1) el potencial de uso que tienen las plataformas de ciencia ciudadana como Naturalista para la generación de nuevo conocimiento y los requisitos que se deben tener en cuenta para su uso      y publicación (ej. tipos de licencia), y 2) la estructura básica de los artículos científicos de datos o DataPapers.

Conocer de forma general los protocolos de curaduría básicos (y vigentes) para el manejo y gestión de datos de biodiversidad antes, durante y después de realizar el ingreso de especímenes a una colección biológica, con énfasis en herbarios y colecciones entomológicas.

  • Conocer las diferentes técnicas de colecta y preservación de los especímenes botánicos y entomológicos que garanticen muestras representativas de las especies y su preservación a largo plazo.
  • Conocer e implementar el estándar para datos de Biodiversidad Darwin Core (Núcleo Darwin, por su nombre en español) para la sistematización e integración de la información asociada a muestreo de biodiversidad y registros resguardados en colecciones biológicas (ej. Metadatos y datos de etiqueta de colecta).
  • Conocer el protocolo general para la movilización de diferentes tipos de conjuntos de datos de biodiversidad a través de plataforma de acceso público, GBIF.
  • Revisar herramientas de código abierto (lenguaje R) para la descarga y gestión masiva de Big data de biodiversidad.
  • Promover mecanismos de ciencia abierta a través de uso de plataformas como Naturalista o publicaciones de datos (ej. Data papers).

Sesiones teórica -prácticas. El curso se desarrollará bajo una modalidad mixta que alternará según el tema, sesiones teóricas y conferencias magistrales entre las 9 y 14 hrs, y la parte práctica de 14 a 17 hrs donde se realizarán ejercicios o actividades de colección según el tema tratado. Es indispensable que cada estudiante tenga su propia laptop.

Salidas de campo. Se realizarán 2 salidas de campo para la colecta de plantas e insectos en dos localidades peri-urbanas de la ciudad de Pátzcuaro (Cerro El Estribo Grande y Cerro Blanco). Durante esta salida se pondrán en práctica métodos básicos de colecta y registros de información en campo para inventarios biológicos. También se implementará un protocolo para el registro de fotografías que puedan ser cargadas, compartidas y útiles para la plataforma Naturalista.mx, con extensión de uso al proyecto compilatorio (Xictoli data: abejas mexicanas y sus flores)

Trabajo en colección. Los especímenes colectados serán ingresados formalmente al herbario del Centro Regional del Bajío (IEB) y a la colección Entomológica del Centro Occidente Mexicano (CECOM). El trabajo en ambas colecciones se concentrará en la implementación de los protocolos de curaduría para el procesamiento, sistematización y determinación taxonómica general de los especímenes (Ej., herborización, montaje -botánico y entomológico, y etiquetado).

Aviso importante: Sí alguno de los estudiantes tiene algún conjunto de datos propio (Ej., lista de especies o registros de ocurrencias) que quiera integrar y movilizar en GBIF es bienvenido. Obviamente los créditos del conjunto de datos son de sus autores del set de datos, no de los instructores del curso.

Conocimientos básicos de botánica, entomología e informática. Nivel medio en manejo de hojas de cálculo tipo Excel, lenguaje de programación en R (necesario, pero no indispensable), SIG, y en uso de repositorios públicos (Ej., GitHub, Zenobo, necesario, pero no indispensable).

Las personas asistentes al curso deben tener gusto por el trabajo de campo y de gabinete. De preferencia debe ser meticulosas en la sistematización de los especímenes y la información recabada de éstos. Debe tener paciencia y cuidado durante la estandarización de la información. Disposición para realizar trabajo en equipo.

Entrega e incorporación de 20 especímenes botánicos al herbario IEB y su información digitalizada (30%), entrega e incorporación de 50 especímenes a la colección entomológica CECOM y su información digitalizada (30%), entrega de un borrador de un manuscrito de Datos o Data Paper siguiendo las pautas para la carga y movilización de datos a través del IPT-INECOL Bajío (https://www.gbif.org/publisher/f6faa566-47f0-41c9-8056-5d715cae7c23)   en modo de prueba y presentación en mini seminario (30%) y participación en clase (10%).

Tema 1. Introducción a las colecciones biológicas y plataformas de “ciencia ciudadana” como fuentes de información para el Big Data Biológico.

  • Colecciones y sus repositorios.
  • Panorama de la cantidad de datos generados a escala global y nacional.

 

Tema 2. Colecta y preservación de especímenes entomológicos.

  • ¿Qué es una colección entomológica? Conozcamos la Colección Entomológica del Centro Occidente Mexicano (CECOM-INECOL Bajío).
  • Técnicas de colecta y preservación de ejemplares.
  • Recopilación de información biológica y geográfica de los ejemplares colectados.
  • Montaje de especímenes.
  • Toma de fotografías y digitalización de los ejemplares.
  • Sistematización.

Tema 3. Colecta y herborización de ejemplares botánicos.

  • ¿Qué es un herbario? Conozcamos el herbario del Instituto de Ecología del Centro Regional del Bajío (IEB).
  • Técnicas de colecta, prensado y secado de ejemplares.
  • Recopilación de información biológica y geográfica de los ejemplares colectados.
  • Montaje de ejemplares.
  • Escaneo y digitalización de los ejemplares.
  • Sistematización.

 

Tema 4. Acceso abierto a datos sobre biodiversidad.

  • Repositorios públicos de datos biológicos: Global Biodiversity Facility Infrastructure (GBIF), Catalogue of Life (COL), eBird e iNaturalist.
  • ¿Qué significa ser de acceso abierto? Tipos de licenciamiento.
  • Otros repositorios públicos: Zenodo, Dryad y Github.

 

Tema 5. Ciencia Ciudadana Naturalista.

  • Naturalista: ¿qué es? y ¿cómo reusar sus datos?
  • Tipos de proyecto.
  • Campos de observación: tipos y asignación de atributos.
  • Uso de Inteligencia artificial en la detección de imágenes particulares.
  • Descarga de conjuntos de datos.
  • Proyecto Xicotli Data: abejas mexicanas y sus flores.

 

Tema 6. Estándares de intercambio de información sobre Biodiversidad.

  • ¿Qué es TDWG?
  • El estándar Darwin Core y qué tipo de información cubre.
  • Plinian Core y qué problema resuelve.

 

Tema 7. Publicando datos en GBIF.

  • Entendiendo los datos que se publican en GBIF y su licenciamiento.
  • Cómo preparo mi información para publicarla.
  • Herramientas útiles para la preparación de los datos.
  • Qué se entiende por calidad de los datos y qué tengo que observar.

 

Tema 8. Artículos científicos de datos: Data Papers.

  • ¿Qué observar al momento de publicar un Data Paper?
  • Estructura de un Data Paper.
  • Dónde alojo los datos para mi Data Paper.
  • Algunas revistas dónde publicar mi Data Paper.