Eventos :: Cursos :: Gestión y visualización de datos con R. Convirtiendo datos en historias 4a edición

Títulos y resumen en todas partes

Convirtiendo datos en historias

La visualización de datos útil e inteligente es un aspecto clave para sacar el máximo rendimiento a la información y ayudar a la divulgación de resultados y toma de decisiones. La frase hecha, una imagen vale más que mil palabras, tal vez nunca tuvo tanta relevancia como hoy en día, en la era del big-data.

Uno de los principales cambios del siglo XXI respecto a épocas pasadas ha sido la vertiginosa irrupción de la tecnología en nuestras vidas. La tecnología ha producido profundos cambios en la sociedad, en la forma de trabajar, de comunicar, en la gestión de recursos y la ciencia. Uno de esos cambios ha sido la disponibilidad de datos, por el creciente uso de dispositivos digitales, pero también por la cada vez mayor capacidad de captación, almacenaje y distribución de datos. Así, la disponibilidad de datos es cada vez mayor, a veces incluso abrumadora. Pero…¿de qué sirven los datos si son erróneos o no somos capaces de interpretarlos? Con una disponibilidad cada vez mayor de grandes bases de datos es necesario “democratizar” el conocimiento en la gestión de estas herramientas. Gestionar bases de datos de forma eficiente y sabiendo distinguir el ruido de la señal que proporcionan los datos, conseguiremos contar lo que los datos tienen que decir y generar valor añadido en la toma de decisiones.  
 
 
Fecha: 24/09/2024
Hora: 09 : 30
Duración: 10 Días 40 Horas 
Localización: Aula virtual
Contacto: Maribel Reviriego
Teléfono: 666439820
Coste: Socios de la AEET/SIBECOL: 275 € - Resto: 375 €.


El tratamiento previo de los datos es fundamental para minimizar el riesgo que supone la toma de decisiones basada en información poco precisa o errónea. Dicho tratamiento debe ser ordenado y reproducible para ser eficaz, pero esto no basta para encontrar el valor añadido y contribuir a la toma de decisiones, el siguiente paso es darles la palabra a los datos, a través de su visualización. La visualización de datos útil e inteligente es un aspecto clave para sacar el máximo rendimiento a la información y ayudar a la divulgación de resultados y toma de decisiones. La frase hecha, una imagen vale más que mil palabras, tal vez nunca tuvo tanta relevancia como hoy en día, en la era del big-data.  
 
Mediante la visualización de datos podemos transmitir historias con una estructura narrativa bien definida (Data storytelling) logrando una comunicación eficaz y un objetivo último, influir en el tema en cuestión. El curso aporta un enfoque estructurado para comunicar resultados científicos a partir de los datos, que involucra una combinación de tres elementos: datos, visualización y narrativa. Cuando unimos estos tres elementos (Visualización + Narración + Datos) logramos contar una historia con nuestros datos, logramos influenciar y divulgar de manera más eficaz (Figura 1)
.



Figura 1. Flujo de trabajo para gestionar, comprender y comunicar datos científicos eficazmente.


 Objetivos: 
 
El objetivo de este curso consiste en dotar de herramientas para la gestión y visualización de datos que permita transmitir el mensaje deseado eficazmente. Esto pasa por enseñar un método de trabajo intuitivo, ordenado y reproducible.
Al concluir el curso, los participantes habrán adquirido habilidades sólidas en las técnicas de adquisición, manipulación, gestión y visualización de datos. Además, contarán con un entendimiento claro sobre cómo estructurar y presentar gráficos de manera elegante y efectiva para comunicar resultados científicos. Los objetivos concretos que se esperan son:
 
  1. Dar a conocer al alumno la importancia de la manipulación y visualización de datos y cómo se pueden enfocar para contar historias que deriven en una comunicación efectiva de resultados.
  2. Utilizar el entorno de programación R para formar al alumno/a en las principales técnicas de gestión y visualización de datos.
  3. Formar al alumno/a en paquetes de R enfocados a la gestión, visualización y análisis de datos basados en el ecosistema de tidyverse (dplyr, stringr, ggplot2, lubridate, etc.) y otros paquetes encaminados a una gestión, ordenada, eficaz e intuitiva de los datos:  data.table, magritrr, dlookr, errorlocate, CoordinateCleaner, jtools o pathwork.
  4. Aprender a visualizar y comunicar de manera efectiva.
  

 Destinatarios:  
 
Personas con interés en la gestión y visualización de datos que permita obtener valor añadido de los mismos, de cara a su publicación científica u otras formas de comunicación de resultados basados en datos. Así, una población natural de interés para este curso son estudiantes de máster o doctorado, así como investigadores post-doc o senior que quieran revisar su manera de presentar sus resultados científicos. Pero también gestores/as públicos o personal de empresas que trabajen con datos (especialmente ambientales, con posicionamiento) que tenga interés en la gestión y visualización de datos más comunes. Para un buen aprovechamiento del curso es necesario que los alumnos tengan un conocimiento previo del ambiente de trabajo R (importar datos sencillos, manejar arreglos de datos, hacer gráficas y análisis sencillos). Parte de los aspectos analíticos que cubriremos irán destinados a visualizar y comunicar de manera eficaz los resultados procedentes de los principales análisis estadísticos utilizados en biología. Se recomienda, por tanto, poseer conocimientos básicos de estadística, principalmente modelos lineales y análisis multivariantes. Las personas participantes deberán utilizar su propio ordenador. Previamente al comienzo del curso deberá instalarse: la última versión de R . Previamente al comienzo del curso deberá instalarse: la última versión de R (https://cloud.r-project.org/) y la última versión de Rstudio.


 Programa: 

El curso tiene un componente eminentemente práctico con contenidos teóricos asociados. El programa del curso se desarrolla en tres módulos interrelacionados que aportan un enfoque estructurado que permite manejar, comprender y comunicar de manera eficaz datos científicos (Figura 1). Durante todo el curso los alumnos resolverán casos prácticos basados en sus propios datos o en datos aportados por el profesorado.
.
 

  Módulo / Contenido
 
 Profesor   nº horas

Modulo 1.  Programación más utilizada con R
 
Introducción a R y Rstudio principalmente enfocado a comprender los tipos de objetos de R y las herramientas de programación más utilizadas.

 
  1. Introducción a R y RStudio (consola, scripts, instalación paquetes).
  2. Fundamentos básicos de R: tipos de objetos.
  3. Introducción a la programación imperativa: bucles for y bucles while.
  4. Introducción a la programación funcional: definición de funciones en R e Iteraciones sobre argumentos.
Carlos Lara Romero (Profesor Univ. Rey Juan Carlos) 8

Modulo 2. Gestión de datos en R
 
Adquisición, validación, limpieza y transformación de datos utilizando los paquetes tidyverse (stringr, dplyr, forcats, readr, readxl, lubridate), data.table y CoordinateCleaner entre otros.

 
  1. Introducción a la Gestión de Bases de Datos: principios FAIR y Planes de Gestión de Datos.
  2. Datos ordenados o tidy data. Presentación de la colección de paquetes Tidyverse.
  3. Adquirir y Exportar datos en R (Paquetes data.table, readxl, readr, rgbif, climaemet).
  4. Ordenación, selección y filtrado de datos (Paquetes dplyr, purr, magrittr, CoordinateCleaner).
  5. Transformación y agrupamiento de datos (Paquetes dplyr, stringr, forcats, purr, magrittr).
  6. Tratamiento de datos tipo fechas y fecha-hora (Paquete Lubridate).
  7. Detección, eliminación e imputación de valores atípicos (outliers) y datos faltantes (Paquetes MICE, missForest y Hmisc).
Carlos Lara Romero (Profesor Univ. Rey Juan Carlos) 16

Módulo 3. Visualización y comunicación eficiente de datos
 
Formación en técnicas de visualización enfocadas al análisis exploratorio de los datos y a la presentación eficiente de los resultados obtenidos a través de los principales análisis estadísticos utilizados en biología. El paquete de R  ggplot2 y sus paquetes satélites, patchwork, ggpubr o ggfortify permiten construir gráficos elegantes que muestran de manera eficiente análisis descriptivos y estadísticos complejos.  
  1. Principios de visualización de datos, atención visual y paletas de colores. 
  2. Fundamentos básicos de ggplot2.
  3. Visualización exploratoria de datos: gráficos de dispersión, gráficos de barras, diagramas de cajas (Box-plots), gráficos de violín (violin plots), gráficos de mosaico, Representar distribuciones: Histogramas y gráficos de densidad (kernel density plots). 
  4. Haciendo que los datos hablen mediante la mejora de  gráficos creados con ggplot2: ordenar categorías,  modificar ejes, colores, elección del tipo de símbolo más adecuado, fuentes, leyendas, etiquetas, anotaciones y temas (Themes, ggrepel, forcats, scales, paletas de colores).
  5. Gráficos con múltiples variables (Grouping y faceting) y gráficos multipanel. Anotaciones en los gráficos (cowplot, patchwork).
  6. Exportar gráficos.
  7. Creación de mapas a partir de datos georreferenciados.
Carlos Lara Romero (Profesor Univ. Rey Juan Carlos) 16





























































 Características:  

Profesores:
  • Carlos Lara Romero [carlos.lara.romero@gmail.com], Profesor Universidad Rey Juan Carlos

Lugar de celebración: Sala virtual.

Fechas: 10 sesiones, distribuidas en 1 sesión semanal de 4 horas, hasta completar 40 horas, durante los meses de septiembre, octubre y noviembre:
 
  • Septiembre: 24/09/2024,
  • Octubre: 01/10//2024, 08/10/2024, 15/10/2024, 22/10/2024, 29/10/2024,
  • Noviembre: 05/11/2024, 12/11/2024, 19/11/2024, 26/11/2024

Horario: mañana (9.30-13.30)

Precio: Socios Regulares y Estudiantes de la AEET/SIBECOL: 275 € - Resto: 375 €.

Duración: 40 horas 

Número de plazas: 20 

Plazo de matriculación: abierto hasta el 02/09/2024

Asistencia obligatoria: 90% mínimo de horas programadas sin posibilidad de falta justificada para obtener el certificado de asistencia. 


 Organiza: 


 
              
 
 



 Inscripción: 
 
Clickea en el enlace "Registrar" situado dentro del cuadro situado en la esquina superior derecha. La Secretaría de la AEET te enviará una notificación personalizada confirmándote la reserva de plaza e indicándote las instrucciones para proceder al pago de la cuota de inscripción. 

 
 Pagos: 

El pago ha de realizarse mediante ingreso en cuenta o trasferencia bancaria a la CC: ES70 0073 01005804 9730 5102, en la entidad Openbank. Los ingresos en cuenta se pueden hacer en cualquier oficina del Banco Santander.
Una ver realizado el abono por favor enviadnos copia del comprobante de pago a secretaria@aeet.org. No olvides indicar los datos que deben constar en la factura.

Las cancelaciones de asistencia notificadas con menos de 30 días de antelación al comienzo del curso, no tendrán derecho a reembolso
 
Nuestros datos fiscales:
 
ASOCIACIÓN ESPAÑOLA DE ECOLOGÍA TERRESTRE
CIF: G50359017
Dpto. Biología y Geología
Universidad Rey Juan Carlos, URJC
c/Tulipán s/n
28933 Móstoles, Madrid



 Certificación: 
 
La organización aportará certificados de asistencia una vez finalizado el curso. Mínima asistencia requerida del 90% de total de horas lectivas.


Cualquier información adicional en: e-mail: secretaria@aeet.org
 

Actividades previstas