COnVIDa - Monitorización de datos de COVID19 en España

Introducción

COnVIDa es una herramienta desarrollada por el Laboratorio de Ciberseguridad y Ciencia de Datos de la Unviersidad de Murcia que permite recopilar fácilmente datos relacionados con la pandemia de COVID19 de distintas fuentes de datos, para el caso de España, y visualizarlos de manera gráfica. Contacte con nosotros a través de convida@listas.um.es.

COnVIDa - Vista general

¿Cómo usar COnVIDa?

Para utilizar la herramienta, en primer lugar deberemos seleccionar el rango de fechas para el cual queremos recolectar datos.

Selección del rango de fechas

A continuación seleccionaremos la región o regiones de España que nos interesen.

Selección de regiones

Para terminar, simplemente seleccionaremos aquellos ítems de datos dentro de cada fuente de datos (COVID19, INE, Movilidad, MoMo y AEMET) que queramos conocer y automáticamente se mostrarán todos los datos seleccionados en las gráficas principales, así como unas respectivas tablas resumen de los mismos. Es importante destacar que al pasar el ratón por encima de cada ítem de datos se nos mostrará una descripción de los mismos.

Selección de fuentes de datos

COnVIDa ofrece dos tipos de visualización de datos: temporal y por regiones. En la visualización temporal (fíjese en que esté activado el panel) se mostrarán en la gráfica los valores diarios para aquellos datos de tipo temporal de los que se disponga de información (los datos estadísticos del INE no tienen sentido aquí). Por ejemplo, si seleccionamos los casos de COVID19, los índices de tabaquismo, la movilidad en parques, las defunciones observadas, y la insolación; en Murcia, Madrid, Cuenca, Granada y España en su conjunto; desde el 21/02/2020 hasta el 21/01/2021; en el eje X se dividirá en los días entre estas dos fechas, mientras que en el eje Y se mostrarán los tipos de datos seleccionados para esos lugares geográficos. Como los datos pueden tener distinta escala, en la superposición es posible que unas variables hagan insignificantes a otras, pero en la parte superior derecha se puede explorar en detalle la gráfica interactivamente.

Gráfica de líneas con escala lineal

Adicionalmente, también es posible cambiar el tipo de gráfica, escogiendo entre gráfica de líneas o gráfica de barras.

Gráfica de barras con escala lineal

Por su parte, en la visualización por regiones se subdivide en dos paneles. En la izquierda, los datos agrupados por regiones seleccionadas y agregados en diagramas de cajas y bigotes (teniendo en cuenta las series de datos para el rango temporal seleccionado). Una vez graficados los datos, es posible cambiar fácilmente la escala de la gráfica, o bien lineal, o bien logarítmica. La escala logaritimica es útil para visualizar simultáneamente series de datos con distintos órdenes de magnitud. En la derecha, se muestra un mapa nacional donde aparecen las regiones seleccionadas y cuyos datos estadísticos se pueden comparar directamente. En el mapa sólo es posible representar a la vez un tipo de granularidad geográfica (el país entero, comunidades autónomas, o provincias), una medida (la media, máximo, mínimo, o los principales percentiles), y una variable.

Gráfica de regiones

Por último, cada tabla de resumen muestra, como su propio nombre indica, un resumen estadístico de cada uno de los ítems de datos seleccionados, incluyendo: un conteo de los datos, la media aritmética de los mismos, la desviación típica, el mínimo, el percentil 25, la mediana, el percentil 75 y el valor máximo de la serie.

Tabla resumen

Como se puede observar, se ofrecen dos botones para descargar, o bien todos los datos recolectados según los citerios especificados por el usuario, o bien la tabla resumen. COnVIDa ofrece la posibilidad de descargar cualquiera de estas dos tablas de datos en los formatos de CSV, XLS, JSON y HTML.

Descargar datos de COnVIDa

Fuentes de datos

La versión actual de COnVIDa incluye 5 fuentes de datos relacionadas con la pandemia de COVID19 en España. Dichas fuentes son:

Como se ha comentado anteriormente, al pasar el ratón por encima de cada uno de los ítems de datos, se mostrará automáticamente la descripción de los mismos.

Código fuente

COnVIDa ha sido desarrollado desde su misma concepción como un proyecto de Ciencia Abierta con el ánimo y el espíritu de servir y ayudar a quien pueda necesitarlo en el contexto de la pandemia de COVID19 en España. En este sentido, todo el código fuente del proyecto se encuentra públicamente accesible a través del siguiente repositorio, donde también se incluye un manual de desarrollador (solamente en inglés):

https://github.com/CyberDataLab/COnVIDa

Limitaciones

COnVIDa nace desde el Laboratorio de Ciberseguridad y Ciencia de Datos de la Universidad de Murcia (CyberDataLab) como respuesta desinterasada a la situación crítica generada por la pandemia. De esta forma, a pesar de la implicación y capacidades técnicas invertidas, el proyecto cuenta con limitaciones como la dependencia de fuentes externas para recolectar datos (por lo que pueden fallar o tener valores inválidos), pequeños bugs en la página web, o ciertas impurezas en la visualización de los datos.

Referencias

E. Martínez Beltrán, M. Quiles Pérez, J. Pastor Galindo, P. Nespoli, F. García Clemente, and F. Gómez Mármol. “COnVIDa: COVID 19 multidisciplinary data collection and dashboard “, under review in Journal of Biomedical Informatics, 2020.


Iré actualizando la entrada del blog conforme se introduzcan mejoras en la herramienta.

Gracias por su tiempo y atención, no dudes en contactar conmigo para cualquier duda o sugerencia.

Enrique Tomás :man_technologist: