Podemos analizar los datos mundiales de casos reportados para la enfermedad por coronavirus (CoViD-19) del repositorio del Centro de Ciencias e Ingeniería de Sistemas de la Universidad Johns Hopkins (JHU CSSE) https://github.com/CSSEGISandData/COVID -19
Los conjuntos de datos están disponibles en dos modalidades, como secuencias de series de tiempo y según el estado de la persona (confirmado, fallecido o recuperado).
Gracias a este paquete tenemos disponibles varias funciones de análisis, visualización y modelado que nos permitirán calcular y visualizar el número total de casos, el número total de cambios y la tasa de crecimiento a nivel mundial o para una ubicación geográfica específica.
Incluso tenemos para generar el modelo Susceptible-Infected-Recovered (SIR) para la propagación de la enfermedad. (beta)
Un fantástico recurso implementado en librería de R para poder trabajar en clase con datos completamente actualizados y modelos ya prediseñados, con simples líneas de código nos permitirá estudiar los datos de una forma sencilla y visual.
Después de esta breve introducción de cómo funciona esta librería os quiero añadir en este articulo algunos comandos y funcionalidades para verlo de una forma mucho más práctica.
Instalamos la librería en nuestro entorno de R
Install.packages(“covid19.analytics”)
Cargamos la librería para poder usarla
library(covid19.analytics)
Ahora ya que estamos listos podemos empezar a usar los datos.
La función covid19.data () permite a los usuarios obtener datos en tiempo real sobre los casos notificados por CoViD19 del repositorio CCSE de la JHU, en las siguientes modalidades:
- «aggregated» para el último día, con una gran ‘granularidad’ de regiones geográficas (es decir, ciudades, provincias, estados, países)
- «time series» para regiones geográficas acumuladas más grandes (provincias / países)
- «deprecated»: también incluimos el estilo de datos original en el que se informaron inicialmente estos conjuntos de datos.
Los conjuntos de datos también incluyen información sobre las diferentes categorías (estado) «confirmado» / «defunciones» / «recuperado» de los casos reportados diariamente por país / región / ciudad.
Ejemplo
#obtenemos en “data” todos los datos actuales del COVID19 en todas las ciudades registradas
data <- covid19.data()
View(data)
Vamos a obtener por secuencia de tiempo todos los datos confirmados por COVID19
data_c <- covid19.data(case="ts-confirmed")
View(data_c)
Recordar que podemos jugar con estas secuencias de tiempo y los diferentes estados.
Time Series data | |
ts-confirmed | Datos confirmados |
ts-deaths | Datos de fallecidos |
ts-recovered | Datos de recuperados |
ts-ALL | Datos combinados |
Una función rápida para ver los casos principales por región para series de tiempo y registros agregados
report.summary ()
Ejemplo de España
report.summary(geo.loc="Spain")
Comparamos las dos ciudades primeras de USA
report.summary(Nentries=2, geo.loc="US")
Podemos sacar los totales confirmados por región a lo largo de una línea de tiempo
data_c <- covid19.data(case="ts-confirmed")
tots.per.location(data_c, geo.loc = "US")
Ratio de crecimiento en Italia de los casos de fallecidos.
data_d <- covid19.data(case="ts-deaths")
growth.rate(data_d, geo.loc = "Italy")
Mapas en Vivo
Datos de fallecidos a nivel mundial
data_d <- covid19.data(case="ts-deaths")
live.map(data_d)
Y para terminar este listado de ejemplos podemos usar el comando SIR.model para generar nuestro modelo epidemiológico.
#SIR
data_c <- covid19.data(case="ts-confirmed")
generate.SIR.model(data_c, "Spain", tot.population = 46490000)
Con este pequeño articulo de ayuda os he querido mostrar esta útil librería donde de una manera sencilla y sin tener grandes conocimientos de R podemos generar interesantes modelos de datos.
Si queréis investigar y avanzar más en esta librería aquí os dejo las referencias.
https://github.com/mponce0/covid19.analytics
https://cran.r-project.org/web/packages/covid19.analytics/index.html