Eventos :: Cursos :: Gestión y visualización de datos con R. Convirtiendo datos en historias

Títulos y resumen en todas partes

Convirtiendo datos en historias

La visualización de datos útil e inteligente es un aspecto clave para sacar el máximo rendimiento a la información y ayudar a la divulgación de resultados y toma de decisiones. La frase hecha, una imagen vale más que mil palabras, tal vez nunca tuvo tanta relevancia como hoy en día, en la era del big-data.

Uno de los principales cambios del siglo XXI respecto a épocas pasadas ha sido la vertiginosa irrupción de la tecnología en nuestras vidas. La tecnología ha producido profundos cambios en la sociedad, en la forma de trabajar, de comunicar, en la gestión de recursos y la ciencia. Uno de esos cambios ha sido la disponibilidad de datos, por el creciente uso de dispositivos digitales, pero también por la cada vez mayor capacidad de captación, almacenaje y distribución de datos. Así, la disponibilidad de datos es cada vez mayor, a veces incluso abrumadora. Pero…¿de qué sirven los datos si son erróneos o no somos capaces de interpretarlos? Con una disponibilidad cada vez mayor de grandes bases de datos es necesario “democratizar” el conocimiento en la gestión de estas herramientas. Gestionar bases de datos de forma eficiente y sabiendo distinguir el ruido de la señal que proporcionan los datos, conseguiremos contar lo que los datos tienen que decir y generar valor añadido en la toma de decisiones.  
 
Fecha: 20/09/2021
Hora: 09 : 00
Duración: 5 Días 35 Horas 
Localización: Aula virtual
Contacto: Leyre Jiménez-Eguizábal
Teléfono: 629638969
Registrar: Registrar
Coste: Socios de la AEET/SIBECOL: 250 € - Resto: 350 €.



El tratamiento previo de los datos es fundamental para minimizar el riesgo que supone la toma de decisiones basada en información poco precisa o errónea. Dicho tratamiento debe ser ordenado y reproducible para ser eficaz. Pero esto no basta para encontrar el valor añadido y contribuir a la toma de decisiones, el siguiente paso es  darles la palabra a los datos, a través de su visualización. La visualización de datos útil e inteligente es un aspecto clave para sacar el máximo rendimiento a la información y ayudar a la divulgación de resultados y toma de decisiones. La frase hecha, una imagen vale más que mil palabras, tal vez nunca tuvo tanta relevancia como hoy en día, en la era del big-data.  
 
Mediante la visualización de datos podemos transmitir historias con una estructura narrativa bien definida (Data storytelling) logrando una comunicación eficaz y un objetivo último, influir en el tema en cuestión. El curso aporta un enfoque estructurado para comunicar resultados científicos a partir de los datos, que involucra una combinación de tres elementos: datos, visualización y narrativa. Cuando unimos estos tres elementos (Visualización + Narración + Datos) logramos contar una historia con nuestros datos, logramos influenciar y divulgar de manera más eficaz (Figura 1)
.



Figura 1. Flujo de trabajo para gestionar, comprender y comunicar datos científicos eficazmente.


 Objetivos: 
 
El objetivo de este curso consiste en dotar de herramientas para la gestión y visualización de datos que permita transmitir el mensaje deseado eficazmente. Esto pasa por enseñar un método de trabajo intuitivo, ordenado y reproducible.
Las personas participantes en el curso finalizarán el mismo familiarizadas con las técnicas de adquisición, manipulación, gestión y visualización de datos. Así como con una idea clara de cómo estructurar y presentar los principales análisis estadísticos utilizados en biología para comunicar resultados científicos de manera elegante y efectiva. Los objetivos concretos que se esperan son:
 
  1. Dar a conocer al alumno la importancia de la manipulación y visualización de datos y cómo se pueden enfocar para contar historias que deriven en una comunicación efectiva de resultados
  2. Utilizar el entorno de programación R para formar al alumno/a en las principales técnicas de gestión y visualización de datos.
  3. Formar al alumno/a en paquetes de R enfocados a la gestión, visualización y análisis de datos basados en el ecosistema de tidyverse (dplyr, stringr, ggplot2, lubridate, etc.) y otros paquetes encaminados a una gestión, ordenada, eficaz e intuitiva de los datos: data.table, magritrr, errorlocate, CoordinateCleaner, jtools, Plotly's o ggfortify.
  4. Aprender a visualizar y comunicar de manera efectiva los resultados procedentes de los análisis estadísticos más comunes.
  5. Afianzar la relación entre la difusión de la ciencia y el concepto de “data storytelling”.
  

 Destinatarios:  
 
Personas con interés en la gestión y visualización de datos que permita obtener valor añadido de los mismos, de cara a su publicación científica u otras formas de comunicación de resultados basados en datos. Así, una población natural de interés para este curso son estudiantes de máster o doctorado, así como investigadores post-doc o senior que quieran revisar su manera de presentar sus resultados científicos. Pero también gestores/as públicos o personal de empresas que trabajen con datos (especialmente ambientales, con posicionamiento) que tenga interés en la gestión y visualización de datos más comunes. Para un buen aprovechamiento del curso es imprescindible que los alumnos tengan un conocimiento previo del ambiente de trabajo R (importar datos sencillos, manejar arreglos de datos, hacer gráficas y análisis sencillos). Parte de los aspectos analíticos que cubriremos irán destinados a visualizar y comunicar de manera eficaz los resultados procedentes de los principales análisis estadísticos utilizados en biología. Se recomienda, por tanto, poseer conocimientos básicos de estadística, principalmente modelos lineales y análisis multivariantes. Las personas participantes deberán utilizar su propio ordenador.


 Programa: 

El programa del curso se desarrolla en tres módulos interrelacionados que aportan un enfoque estructurado que permite manejar, comprender y comunicar de manera eficaz datos científicos (Figura 1). El cuarto módulo permitirá a los alumnos resolver un caso práctico basado en sus propios datos o en datos aportados por el profesorado. El curso tiene un componente eminentemente práctico con contenidos teóricos asociados.

 

  Módulo / Contenido
 
nº horas

Modulo 1.  Programación con R
 
Introducción a R y Rstudio principalmente enfocado a comprender los tipos de objetos de R y las herramientas de programación más utilizadas.
  1. Introducción a R y RStudio (consola, scripts, instalación paquetes)
  2. Fundamentos básicos de R: tipos de objetos, introducción  a la definición de funciones, expresiones condicionales y For-loops
  3. Datos ordenados o tidy data. Presentación de la colección de paquetes Tidyverse
4

Modulo 2. Gestión de datos en R
 
Adquisición, validación, limpieza y transformación de datos utilizando los paquetes tidyverse (stringr, dplyr, forcats, readr, readxl, lubridate), data.table, validate, errorlocate y CoordinateCleaner entre otros.
  1. Adquirir y Exportar datos en R (Paquetes data.table, readxl, readr, rgbif, climaemet
  2. Validación y limpieza de datos aplicando reglas de validación e indicadores de calidad (Paquetes validate, errorlocate y CoordinateCleaner, magrittr
  3. Ordenación, selección y filtrado de datos (Paquetes dplyr, purr, magrittr
  4. Transformación y agrupamiento de datos (Paquetes dplyr, stringr, forcats, purr, magrittr
  5. Tratamiento de datos tipo fechas y fecha-hora (Paquete Lubridate
  6. Detección, eliminación e imputación de valores atípicos (outliers) y datos faltantes (Paquetes MICE, missForest y Hmisc)
14

Módulo 3. Visualización y comunicación eficiente de datos
 
Formación en técnicas de visualización enfocadas al análisis exploratorio de los datos y a la presentación eficiente de los resultados obtenidos a través de los principales análisis estadísticos utilizados en biología. El paquete de R ggplot2 y sus paquetes satélites, ggpubr o ggfortify permiten construir gráficos elegantes que muestran de manera eficiente análisis descriptivos y estadísticos complejos.  
  1. Principios de visualización de datos, atención visual y paletas de colores. 
  2. Fundamentos básicos de ggplot2
  3. Visualización exploratoria de datos: gráficos de dispersión, gráficos de barras, diagramas de cajas (Box-plots), gráficos de violín (violín plots) y gráficos de mosaico. 
  4. Haciendo que los datos hablen mediante la mejora de  gráficos creados con ggplot2:ordenar categorías,  modificar ejes, colores, elección del tipo de símbolo más adecuado, fuentes, leyendas, etiquetas, anotaciones y temas (Themes, ggrepel, forcats, scales, paletas de colores, ). 
  5. Gráficos con múltiples variables (Grouping y faceting) y gráficos multipanel. Anotaciones en los gráficos (cowplot, patchwork) 
  6. Exportar gráficos 
  7. Gráficos para representar resultados de modelos estadísticos 
  8. Representar distribuciones: Histogramas y gráficos de densidad (kernel density plots)
    - Gráficos de correlación (ggcorrplot)
    - Gráficos de diagnóstico y representación de modelos lineales (LMs) y su extensión en modelos  generalizados (GLMs) y mixtos (LMMs y GLMMs)
    - Gráficos de supervivencia (Survial plots)
    - Gráficos para representar Análisis Multivariantes (e.g. Biplot, NMDS plot)
    - Gráficos de series temporales 
  9. Creación de mapas a partir de datos georreferenciados 
  10. Introducción a gráficos interactivos (Paquetes Plotly)
14

Modulo 4. Planteamiento y resolución de un Casos de estudio.
 
Resolución de casos de estudio planteados por los propios alumnos o aportados por el profesorado 
3








































































 Características:  

Profesores: Carlos Lara Romero [carlos.lara.romero@gmail.com], Investigador Juan de la Cierva y Gema Escribano-Ávila [gema.escribano.avila@gmail.com], Científica de datos.
Lugar de celebración: Sala virtual.
Fechas: 20 al 24 de Septiembre de 2021
Horario: mañana y tarde (9.30-14.00 /15.00-17.30)
Precio: Socios de la AEET/SIBECOL: 250 € - Resto: 350 €.
Duración: 35 horas 
Número de plazas: 20 
Plazo de matriculación: abierto hasta el 30/08/2021
Asistencia obligatoria a un 90% mínimo de horas programadas sin posibilidad de falta justificada para obtener el certificado de asistencia. 


 Organiza: 


 
              
 
 



 Inscripción: 
 
Clickea en el enlace "Registrar" situado dentro del cuadro situado en la esquina superior derecha. La Secretaría de la AEET te enviará una notificación personalizada confirmándote la reserva de plaza e indicándote las instrucciones para proceder al pago de la cuota de inscripción. 

 
 Pagos: 

El pago ha de realizarse mediante ingreso en cuenta o trasferencia bancaria a la CC: ES70 0073 01005804 9730 5102, en la entidad Openbank. Los ingresos en cuenta se pueden hacer en cualquier oficina del Banco Santander.
Una ver realizado el abono por favor enviadnos copia del comprobante de pago a info@aeet.org. No olvides indicar los datos que deben constar en la factura.
 
Nuestros datos fiscales:
 
ASOCIACIÓN ESPAÑOLA DE ECOLOGÍA TERRESTRE
CIF: G50359017
Dpto. Biología y Geología
Universidad Rey Juan Carlos, URJC
c/Tulipán s/n
28933 Móstoles, Madrid


 Certificación: 
 
La organización aportará certificados de asistencia una vez finalizado el curso. Mínima asistencia requerida del 90% de total de horas lectivas.


Cualquier información adicional en: e-mail: info@aeet.org, tel.: 91 4887329 (de 9:00 a 14:00)
 

Actividades previstas