Análisis de COVID-19 en Argentina

Introducción

Luego de un primer período con bajos contagios y poca propagación a lo largo de Argentina, desde hace dos meses el COVID-19 viene pegando fuerte en el país. El Ministerio de Salud dispone desde el 15 de Mayo de un dataset con cada caso registrado por localidad. Es una base de datos bastante amplia que hemos decidido analizar, considerando en esta primer aproximación algunos factores que nos parecieron interesantes, tales como:

  • Contagios por rango etario
  • Predicciones en base a estudios previos
  • Diferencias entre datasets: Min de Salud vs. COVID Stats AR
  • Mapa con densidad de muertes por departamento/comuna

Contagios por rango etario

Limpieza de datos para análisis de contagiados

De los datos del Ministerio de Salud, tomamos la cantidad de contagiados por rango etario, con un análisis posterior tanto por edades como por sexo. Del dataset se desprenden los siguientes tipos de casos:

Normalización

¿Por qué decidimos normalizar?

# Contagiados
(df_poblacion_contagiados['total'] / df_poblacion['total']) * 100
# Fallecidos
(df_poblacion_fallecidos['total'] / df_poblacion['total']) * 100

Distribución de contagiados por rango etario

Distribución de fallecidos por rango etario

Impacto de fallecidos sobre contagiados

Ahora superpongamos la distribución de fallecidos sobre la de contagiados. Con esto veremos el impacto de los fallecidos que tiene el COVID-19 sobre la población infectada.

Análisis por rango etario y sexo

A continuación, veamos ¿quiénes son más afectados por el COVID-19: los hombres o las mujeres?, ¿existe un género que soporte mejor el virus?. Es interesante observar qué parte de la población es más afectada por el mismo.

Comportamiento de fallecidos en el tiempo

Sobre el dataset del Ministerio de Salud, vamos a tomar algunos campos para analizar las tendencias sobre la curva de fallecidos diarios y acumulados. Sólo tomaremos como válidos los pacientes que hayan sido confirmados con el diagnóstico.

Fallecidos reportados el 25 de Septiembre en función del día de deceso

Predicción del comportamiento sobre el número de fallecidos

El resultado obtenido luego del ajuste a la curva log normal es el siguiente.

COVID Stats Ar

A modo de referencia, es interesante analizar los resultados teniendo en cuenta los datos publicados en COVID Stats. Podemos exportar los datos a un csv accediendo directamente a https://covidstats.com.ar/exportar.

Predicciones con la función logística

Es común observar ajustes de infección y muertes realizados con la muy conocida función logística, ya que su comportamiento muestra un primer crecimiento muy lento, luego un comportamiento exponencial, continuando con un punto de inflexión donde la función cambia de velocidad y finalizando en un crecimiento muy lento. Es un modelo que deriva del comportamiento de crecimiento de población y fué desarrollado por Pierre François Verhulst en 1838 como una mejora al modelo propuesto por Malthus.

Diferencia entre datasets: Ministerio de Salud vs. COVID Stats AR

En esta sección se hará una comparación de los datos del Ministerio de Salud de Argentina y los de COVID Stats AR.

Comparando datos

Para terminar con la comparación de los datos del Ministerio de Salud y COVID Stats AR analicemos los datos en cada dataset mes a mes.

Confirmados vs Confirmados FIS

Confirmados vs Confirmados FA

Confirmados vs Confirmados FIS ajustada

Mapa de Densidad de Fallecidos por Departamento

Analizaremos en este apartado la distribución geográfica de fallecidos. En particular estamos interesados en el comportamiento de la pandemia en zonas densamente pobladas, donde estimamos que puede existir una mayor velocidad de contagio. Utilizaremos el término comuna, departamento o localidad de manera indistinta, siendo ésta la menor unidad divisible en la información que provee el Ministerio de Salud.

Panorama de Argentina
Provincia de Buenos Aires
Zona metropolitana de Buenos Aires
CABA y primer cordón metropolitano
San Salvador de Jujuy y alrededores

Conclusión

Tal como hemos visto, los patrones de contagio indican que las personas económicamente activas son las que más se contagian. A su vez, es curioso cómo los menores de 20 años prácticamente no demuestran positividad ante el virus. Por último, los contagios en los ancianos es muy alto.

--

--

I write about Data Science, AI, ML & DL. I’m electronics engineer. My motto: “Per Aspera Ad Astra”. Follow me in twtr @augusto_dn

Love podcasts or audiobooks? Learn on the go with our new app.

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store
Augusto de Nevrezé

Augusto de Nevrezé

10 Followers

I write about Data Science, AI, ML & DL. I’m electronics engineer. My motto: “Per Aspera Ad Astra”. Follow me in twtr @augusto_dn