Podría considerarse casi un principio en ciencia computacional la siguiente expresión: "Si entra basura, sale basura" ("trash in, trash out", en inglés). Es decir, la "suciedad" en los datos de los que bebe un modelo produce que ese modelo origine predicciones erróneas. Esa es una cuestión de la que ya advertíamos aquí.

Desde el inicio de la pandemia de coronavirus, los datos sobre la enfermedad han estado envueltos en ruido. Los distintos países han establecido metodologías diversas para calificar los casos positivos o, incluso, identificar a las víctimas del COVID-19, la enfermedad causada por el coronavirus SARS-CoV-2. Para colmo, ni siquiera los números de casos que se ofrecen son del todo fiables ya que, como hemos visto, hasta ahora ha habido gran cantidad de enfermos con síntomas compatibles con la pandemia pero leves que han permanecido en sus hogares sin que se les haya realizado un test de comprobación, por lo que se quedan fuera de la estadística.

Además, desconocemos con precisión qué porcentaje de personas han estado infectadas sin apenas síntomas o con manifestaciones muy leves, que incluso han podido confundirse con otras enfermedades. Hasta ahora, se había venido utilizando la estadística de la enfermedad en China como primera referencia, pero a la vista de las discrepancias en letalidad en los distintos países, ya son varias las voces que ponen en cuarentena los datos chinos o abiertamente los consideran falseados.

Por último, en España se han puesto de manifiesto discrepancias metodológicas entre las comunidades autónomas. Por ejemplo, Andalucía ha registrado solo cinco casos, pese a que los días anteriores venía sumando al menos dos centenares de nuevos positivos cada jornada. A eso, la junta de Andalucía ha añadido más confusión al afirmar que se han producido nuevos contagios declarados pero que ha incluido a asintomáticos.

Desde hace días venimos observando cómo cada comunidad autónoma contabiliza a su modo, hasta el punto que el Ministerio de Sanidad ha dejado ya de ofrecer la cifra total de pacientes en UCI por las diferentes maneras de ofrecer los datos de los respectivos sistemas de salud autonómicos. ¿Es eso admisible?

Juan Luis Fernández, catedrático de Matemáticas de la Universidad de Oviedo, quien junto a la también profesora de la misma institución Zulima Fernández-Muñiz lleva semanas modelizando la evolución de la enfermedad en Asturias y en el resto de comunidades autónomas, destaca que "los datos tienen que estar tratados de manera exquisita y diseñados para la toma de decisiones. Esa toma de decisiones quizás no pasa por saber cuántos infectados hay y cuáles son asintomáticos, algo que podría hacerse con un estudio a modo de sondeo sobre una muestra amplia. La toma de decisiones a la que estos modelos deben ayudar es la que guarda relación con las medidas políticas y económicas que debemos tomar".

Ese hecho "no quiere decir que con lo que hay hasta ahora no podamos hacer cosas; al contrario, hay que hacerlas", asegura Fernández. En su opinión, los investigadores "no podemos escondernos en la mala calidad de los datos, sino que debe reclamarse que se utilicen métodos mucho más sofisticados".

A este ruido en la información se añade otra cuestión: los llamados "test rápidos" (en realidad son una prueba para detectar anticuerpos del coronavirus SARS-CoV-2) trastocan la manera en que hasta ahora se computaba a los enfermos.

Y lo hacen por dos razones:

1) Hay más pruebas, dirigidas a pacientes que hasta ahora no llegaban al hospital. Hasta el momento los test de confirmación de la enfermedad (los llamados PCR) se realizaban en las instalaciones hospitalarias a los pacientes que presentaban una sintomatología grave compatible con el COVID-19. En cambio, quienes quedaban en casa con síntomas leves eran monitarizados en sus hogares por los servicios de atención primaria (en Asturias se cuantificó esa bolsa de posibles enfermos en más de 4.500 personas). Ahora, estos test se deberían realizar a personas también con sintomatología leve o en centros residenciales de mayores para detectar a todas las personas contagiadas. Ese hecho, que altera la homogeneidad de los datos recibidos hasta ahora (pacientes con COVID-19 y sintomatología grave) también distorsiona el resultado de los modelos existentes.

2) Comienza a considerarse como positivo a personas con síntomas leves. Ese hecho puede causar que se incrementen los nuevos casos diarios, sin que ello signifique que se han producido más contagios que antes. No obstante, la forma actual de ofrecer los datos no permite distinguir eso. Distinguir cada caso, en cambio, sería clave para poder determinar si se han producido nuevos focos de contagio o solo estamos "viendo" a los pacientes de síntomas leves que hasta ahora permanecían velados.

La confusión se redobla cuando las autoridades no se explican con propiedad. El ministro de Sanidad, Salvador Illa, aún dice hoy en día que España está en el pico de la enfermedad, cuando ese pico de nuevos casos diarios se produjo ya hace más de una semana, como muestran los gráficos.

También utiliza mal el concepto de "aplanar la curva". Esa expresión se refiere a las medidas que se toman para retrasar en el tiempo los contagios, de modo que se evite la saturación del sistema sanitario. La curva, por así decir, ya está aplanada desde el momento en el que se tomaron las medidas de contención, ya que de no haberse hecho el crecimiento exponencial de la enfermedad habría seguido produciéndose por más tiempo.

Lo que, probablemente, quiere decir el ministro es que en la representación de casos totales (que suele hacerse de forma logarítmica, de modo que cada unidad en el eje vertical en realidad representa diez veces más casos) la pendiente de la curva va descendiendo hasta dirigirse a una posición más horizontal, lo que significaría una reducción de los nuevos casos diarios. Esos errores de expresión solo pueden obedecer, sostiene Juan Luis Fernández "a un error también en el modo en que se le asesora científicamente".

En medio de esa basura y confusión, los investigadores asturianos Juan Luis Fernández y Zulima Fernández-Muñiz continúan con su modelo.

Los datos de hoy para Asturias parecen volver a la tendencia descendente que se quebró hace unos días. Como ya ha explicado Juan Luis Fernández "la evolución de los datos termina siendo absorbida por el modelo, que evoluciona también en sus pronósticos".

Ayer hemos visto unos datos que se asemejan más a la tendencia natural de la enfermedad. Ha habido un incremento de 45 nuevos casos y se han producido, lamentablemente, 10 fallecimientos. Como ya se ha dicho, resulta lógico que en un periodo descendente de casos sigan siendo elevados los fallecimientos, ya que estos corresponden de media a personas que comenzaron a presentar síntomas hace ya más de una semana, en un momento en el que se diagnosticaban muchos más casos diarios. Con todo, a esta circunstancia se añade la aparición de focos en centros geriátricos, donde se encuentra la población más sensible y vulnerable ante la enfermedad: los mayores. Atajar cualquier posibilidad de contagio en esos centros es clave para reducir el número de fallecimientos, algo que debería empezar a producirse esta semana.

Descienden también las hospitalizaciones en planta (12 menos) y baja en 3 el número de pacientes en Unidades de Cuidados Intensivos (UCIs). Esa debería ser la tendencia continuada, la de un sistema sanitario menos saturado, aunque aumentasen los nuevos casos diarios, que de forma creciente deberían corresponder a pacientes con sintomatología leve.

En cualquier caso, metidos ya en la quinta semana de confinamiento, muchos de los contagiados iniciales que permanecieron en sus casas deberían haberse ya repuesto. Y, de haber contagiado a familiares en el ámbito doméstico, estos deberían estar ya en fase de iniciar la curación. El riesgo está en que la aparición de nuevos contagios se haya producido fuera del encierro en casa, en espacios en los que se ha producido proximidad de personas, como los supermercados. De ser así, estaríamos comprobando los riesgos evidentes que supondría atenuar el confinamiento si no conlleva estrictas medidas de higiene, distanciamiento y seguridad.

Esta cuestión es importante. El llamado R0, un parámetro que mide el promedio de casos que origina un infectado, debe ser menor que 1 para que se considere que la pandemia está controlada. El R0 evoluciona, disminuyendo, a medida que se ponen más trabas (medidas de distancia social o el drástico confinamiento) a la difusión del virus. Los malos resultados de ayer en Asturias han hecho que, estadísticamente, la propagación de la pandemia en el Principado haya pasado de tener un R0 menor que 1 los últimos días a superarlo, alcanzando un 1,08 (según los datos ofrecidos por el Instituto de Salud Carlos III). En la misma situación, lo que técnicamente podría calificarse como "situación de pandemia no controlada", se encuentran Castilla y León, Extremadura y Valencia.

Con los nuevos datos, el número total estimado de personas infectadas en Asturias se situaría en los 2.600, precisamente el pronóstico que inicialmente dio el modelo de Juan Luis Fernández y Zulima Fernández-Muñiz.

En el conjunto de España, la curva sigue la tendencia descendente:

Impacto de las condiciones meteorológicas

Se ha conocido un estudio preliminar llevado a cabo por el Instituto de Salud Carlos III (ISCIII) y la Agencia Estatal de Meteorología (Aemet) para conocer las variables meteorológicas que pueden ser interesantes de cara a saber la incidencia y propagación de la enfermedad. El resultado encuentra una correlación negativa entre el número de casos y variables como la temperatura o la humedad.

Ese resultado ya había sido advertido hace semanas en un estudio llevado a cabo por el asturiano Juan Luis Fernández y el también asturiano y estudiante de máster en Ingeniería de Telecomunicaciones José María Loché Fernández-Ahúja. El estudio de estos dos investigadores tiene además en consideración otra variable: la altitud.

Loché se preguntó si existiría alguna correlación entre los casos de COVID-19 que se declaraban en los distintos territorios españoles y algunas de sus características climatológicas u orográficas. Para llevar a cabo el análisis, Loché tomó la temperatura media y la humedad de este mes de marzo según la Agencia Estatal de Meteorología (Aemet) y la altitud media de cada territorio.

En la representación gráfica se observa que una temperatura media más elevada y una mayor proximidad al mar pueden ser condiciones que minimicen el impacto del virus, y que los picos corresponden a zonas frías y elevadas. Con menor correlación, también parece observarse un patrón cuando se relacionan los contagios con la humedad, también vinculada a la proximidad al mar y otros factores geográficos.

En este sentido, los investigadores observan una relación del tipo Casos/1.000 habitantes=0.6403-0.0258 x T+ 0.0516 x Altitud (km)- 0.0024 x Humedad, donde la temperatura se mide en grados, la altitud en kilómetros y la humedad se refiere a la humedad relativa. Es decir, hay una correlación negativa con la humedad y la temperatura, pero positiva con la altitud. Se trata de la misma conclusión a la que han llegado la Aemet y el ISCIII.

Pero los investigadores asturianos han ido más allá, y han efectuado el análisis en toda Europa. El siguiente gráfico señala la correlación del número de casos por cada 1.000 habitantes en función de la altura sobre el nivel del mar, donde también se observa una correlación.

La existencia de esa correlación en las comunidades autónomas españolas también parece clara.

Los investigadores asturianos van a actualizar su estudio con los datos obtenidos a lo largo de una semana.

El pronóstico, comunidad a comunidad

Con todo, Juan Luis Fernández y Zulima Fernández-Muñiz continúan con su predicción sobre cómo evolucionará la enfermedad en las distintas comunidades autónomas.

Su modelo permite además obtener un pronóstico de nuevos casos, porcentaje de mortalidad y necesidades hospitalarias para cada territorio. Sus análisis son seguidos por los servicios de Salud de Asturias, Cantabria y Castilla y León, así como por autoridades sanitarias de Estados Unidos, Pakistán o Venezuela.

Este es el pronóstico de evolución del COVID-19 en las distintas autonomías.

Además, en colaboración con el analista informático Oscar González Rodríguez, los matemáticos asturianos proyectan los resultados más probables de los países europeos.