Coronavirus. Our World in Data: cómo detectó el error de la Argentina y qué pasará con el monitoreo

Our World in Data, una organización sin fines de lucro fruto de los esfuerzos de colaboración entre investigadores de la Universidad de Oxford, excluyó de su base de datos sobre tests a la Argentina por un posible sesgo en la "tasa de positividad", anunció ayer por Twitter Edouard Mathieu, uno de los miembros del equipo de datos. La afirmación fue validada por el ministro de Salud, Ginés González García, que reconoció el error y le dio la razón.

Ante el incidente, LA NACION conversó con Esteban Ortiz-Ospina, Jefe de Operaciones e investigador senior de Our World in Data, sobre el cómo detectaron el error y cómo trabaja el prestigioso organismo que constantemente monitorea datos de todo el mundo.

Coronavirus: muere un voluntario que participaba de las pruebas de la vacuna de AstraZeneca en Brasil

-¿Cómo recolectan la información? ¿Siempre utilizan datos oficiales?

-En Our World in Data publicamos datos sobre Covid-19 basados en tres métricas clave: casos confirmados, muertes y pruebas. Todos nuestros datos sobre casos confirmados y muertes provienen del Centro Europeo para la Prevención y el Control de Enfermedades (ECDC). El ECDC europeo publica estadísticas diarias sobre la pandemia de Covid-19 para todos los países disponibles según las cifras oficiales informadas. Confiamos en el ECDC ya que recopila y armoniza datos de todo el mundo. En cuanto a pruebas diagnósticas, ninguna organización ha construido previamente una base de datos global agregada sobre tests. En Our World in Data, por lo tanto, creamos un conjunto de datos de acceso abierto y público. Hemos construido y mantenido esta base de datos desde los primeros días de la pandemia con fuentes oficiales y se actualiza aproximadamente dos veces por semana.

-¿Tienen mecanismos establecidos para verificar la información que recopilan?

Nuestros datos sobre Covid-19 representan una recopilación de datos publicados por fuentes oficiales. Como tal, el objetivo es que lo reportado represente un registro preciso de los datos. Para verificar que lo reportado representa un registro preciso de los datos oficiales empleamos una variedad de procesos de validación de datos. Verificamos cifras no válidas y monitoreamos cada país para detectar cambios abruptos en las tasas de prueba diarias. Para mitigar las disminuciones debidas a los retrasos en los informes, a veces excluimos las observaciones más recientes de un país si este muestra incorrectamente una disminución temporal en el número de tests. Además, decenas de miles de personas ven nuestros datos todos los días, incluidos muchos investigadores de salud, legisladores y periodistas, de los que recibimos una gran cantidad de comentarios. Esto significa que cualquier discrepancia entre nuestros datos y los publicados en los canales oficiales se suele notificar y resolver rápidamente.

-¿Qué hacen con los países para los que los datos oficiales no son muy confiables?

-Nuestro objetivo es incluir todos los datos publicados de fuentes oficiales que cumplan con nuestros criterios. Esta evaluación se basa en la información puesta a disposición del público por las autoridades competentes. Enumeramos todas las ambigüedades y los problemas de datos que conocemos para cada país en nuestras descripciones detalladas de las fuentes.

-¿Por qué decidieron excluir los datos sobre tests en la Argentina?

-Eliminamos los datos de tests en la Argentina de nuestro conjunto de datos porque nos dimos cuenta que muchas pruebas con resultado negativo no se estaban registrando en varias provincias, incluidas algunas grandes como Córdoba. Sospechamos que algo podría estar mal con los datos porque la tasa de positivos era extremadamente alta. Aunque se han observado tasas positivas muy altas en otros países, nunca habíamos observado una tasa positiva tan alta como la calculada recientemente para la Argentina. Poco tiempo después, este problema ha sido confirmado en un comunicado de prensa del Ministerio de Salud, y ha sido documentado también en varios diarios, entre ellos Clarín.

-¿Qué implica un subregistro de los resultados negativos?

-El subregistro de resultados negativos en los tests implica que la tasa positiva (la proporción de pruebas que arrojan un resultado positivo) está sobreestimada. Al momento de tomar la decisión de excluir los datos de la Argentina de nuestro conjunto de datos, la tasa positiva según los datos oficiales era del 76%. Es imposible saber exactamente en qué medida esta cifra está sesgada al alza, hasta que no sepamos en qué medida se estaban restringiendo los resultados negativos. Sin embargo, en cualquier caso, está claro que la tasa positiva en la Argentina es extremadamente alta para los estándares internacionales,lo que indica que no se están realizando suficientes pruebas para monitorear adecuadamente el brote. Es clave recalcar que este problema no afecta los datos sobre casos confirmados o muertes, que siguen estando incluidos en nuestros datos de Covid-19.

-¿Han excluido alguna vez datos de otro país?

-Tenemos criterios claros para la inclusión de datos en nuestra base de datos. No todos los datos de tests publicados por los países cumplen con nuestros criterios, y por lo tanto, no todos los países figuran en nuestro conjunto de datos. En ocasiones ha sucedido que los datos oficiales no cumplen con los criterios solo durante un período de tiempo; una vez que los datos se publican nuevamente de acuerdo con nuestros criterios, los incluimos en nuestro conjunto de datos de nuevo. Nos complace ver que las autoridades argentinas están al tanto del subregistro de pruebas negativas y están comprometidas a abordar el problema. Tan pronto como este problema se haya corregido claramente, comenzaremos a incluir datos de prueba para la Argentina en nuestro conjunto de datos nuevamente.

-¿Solo tienen este problema con la Argentina, o también es un problema que tienen con otros países? ¿Podría mencionar algunos ejemplos?

-Actualmente solo somos conscientes de este problema (en el cual las pruebas negativas no se registran en su totalidad) en el caso de la Argentina. Sin embargo, existen problemas de calidad de datos en otros países. Por ejemplo, varios países de América Latina incluyen resultados positivos de anticuerpos en sus cifras de casos confirmados. Nuestros datos de pruebas no incluyen pruebas de anticuerpos (positivas o negativas), de acuerdo con nuestros criterios. Para estos países, incluimos cifras de pruebas (solo PCR) en nuestro conjunto de datos, pero no derivamos nuestras dos métricas que comparan los casos confirmados con el nivel de las pruebas (la tasa positiva y la proporción de pruebas por caso), ya que los dos conjuntos de datos no son comparables. Este es el caso actualmente de Brasil, Colombia, Costa Rica, Ecuador y Perú.