Análisis sobre la importancia de los datos en momentos de crisis
En estos días de incertidumbre todos nos levantamos pensando ¿cuantos nuevos infectados habrá hoy de
COVID-19? Buscamos en todos lados, intentando saciar esa imperante
necesidad de información que tenemos en esta nueva era, en la que circulan
millones de datos de distintas fuentes y países.
En el Ecuador, los datos oficiales se presentan por medio de la fuente
oficial representada en el Servicio Nacional de Gestión de Riesgos y
Emergencias, los cuales además son publicados en sus redes sociales y su página web, sin embargo, estos datos no pueden ser tomados a
la ligera y es necesario hacer un análisis más profundo en miras de sacar
conclusiones basadas en las evidencias.
Los datos que presentan los organismos oficiales muestran simplemente una
tabla actualizada de frecuencias que intenta describir la situación del
momento, es decir, un conteo de los tests positivos, los decesos, las altas
hospitalarias, edades, provincias, pruebas por confirmar, y otros. Con la intención
de que la población se informe por medio de un gráfico en poco tiempo. Es por ello, que toma cada vez más importancia
que los analistas de datos sepan como mostrar esta información de una manera
visual, fácil de entender y que sobre todo se adapte a los públicos a los que
van dirigidos.
Ahora bien, se puede predecir ¿cuántos
nuevos positivos habrá mañana? La respuesta a esta pregunta es sí, se lo
puede hacer. Para ello, es necesario regresar al panorama mundial en donde se
han recogido más datos desde el inicio de la pandemia. En este caso empezaremos
el análisis con los datos históricos de los nuevos contagiados en cada día, los
cuales podemos obtenerlos en el portal de datos abiertos de Europa, actualizados al día, en esta
página también se reflejan los datos del Ecuador.
Figura 1. Nuevos infectados por día en China,
Italia y España entre el 1 de enero y el 31 de marzo del 2020. Elaboración
propia
Fuente: EU Open Data Portal
Realizando un análisis descriptivo de los datos, se puede ver que en un
inicio el crecimiento del número de nuevos infectados en cada día seguía una
función exponencial, tal y como pronosticaron los expertos. Es decir, que una
persona contagiada podía mañana enfermar a otras tres, esas tres al día siguiente
podían expandirlo cada una a tres más, y así multiplicándose cada día el número
de nuevos contagiados.
Si los datos mostraran que el comportamiento del número de infectados sigue
una función exponencial, podríamos decir “mañana existirán N positivos con una
probabilidad del X%”. Sin embargo, en la Figura 1 se puede ver que desde un
punto en el tiempo los datos ya no siguen una función de este tipo, por lo que
ya no es tan fácil predecir que puede pasar en un futuro. ¿A qué se debe este cambio? Puede ser por otras variables no
analizadas en este momento, por ejemplo, decisiones de política pública como el
#QuédateEnCasa, inversiones en
materia de salud, etc., las cuales proponemos sean analizadas mediante el uso
de técnicas de Business Intelligence,
en donde los datos puedan ser utilizados por expertos en políticas pública para
sacar conclusiones.
Figura 2. Nuevos infectados y fallecidos por día en
Ecuador entre el 1 y 31 de marzo del 2020. Elaboración Propia
Fuente: EU Open Data Portal
Aterrizando el análisis en nuestro país, se puede ver en la Figura 2 que se
produce un fenómeno similar al antes explicado. Con respecto a la Figura 3 no
es pertinente comparar todavía (y esperemos que nunca sea pertinente) con los
casos en España e Italia de las mismas fechas, ya que el número de infectados
en un día de esos países es casi 30 veces mayor que el nuestro y no ayuda en el
análisis. Sin embargo, China en este último mes ha tenido un comportamiento de
nuevos infectados algo peculiar.
Figura 3. Nuevos infectados por día en Ecuador y
China entre el 1 y 31 de marzo del 2020. Elaboración Propia
Fuente: EU Open Data Portal
Entonces, luego de este análisis vuelvo a la pregunta inicial, ¿se puede predecir cuántos nuevos positivos
habrá mañana? Y la respuesta es quizás sí, pero con técnicas
computacionales más complejas como el Machine
Learning, lo que intentaremos analizar en los próximos meses en conjunto
con nuestros estudiantes de maestría en Sistemas de Información mención en Data
Science.
Autor:
Ing. Diego
Riofrío Luzcando, Dr.
Director Digital School
Universidad Internacional SEK
Excelente blog e informaciòn que ayuda a informar a la comunidad.
ResponderEliminar