Entrevistas

Open Covid: Sin datos confiables el Perú no tomará medidas sanitarias eficaces

A casi un año del inicio de la pandemia por Covid-19, el gobierno peruano continúa basando decisiones sanitarias en datos con errores. Ragi Burhum, científico computacional y voluntario de Open Covid-Perú, explica qué problemas persisten en el registro del Estado y las fallas de seguridad en su sistema de información.

image_2021-02-05_15-31-15.png
Perú carece de un sistema integrado de datos, un problema que no es nuevo pero que adquiere mayor importancia al perjudicar un adecuado registro de la situación de la pandemia por la Covid-19.

Esta semana, integrantes del grupo Open Covid-Perú enviaron una carta dirigida al presidente Francisco Sagasti, alertando sobre errores persistentes en los datos que registra el Gobierno sobre la pandemia. No es la primera vez que informan del problema, pero ahora, en plena segunda ola de Covid-19, decidieron hacer un llamado más urgente.

El equipo está formado por Ragi Burhum, Manuel Bellido, Juan Carlos Carbajal, Rodrigo Torres, Víctor Sánchez y Patrick Wieghardt, quienes todos los días realizan, de manera voluntaria, un trabajo de análisis y visualización de datos abiertos del gobierno para hacer seguimiento a la evolución de la pandemia en nuestro país. Esa labor es la que les ha permitido darse cuenta de errores en el procesamiento de datos y brechas de seguridad que afectan el derecho a la privacidad de la ciudadanía e incluso exponen información interna del Estado.

La carta de Open Covid-Perú al presidente incluye un anexo con las pruebas de esos problemas: usuario y contraseña del sistema hospitalario que se puede encontrar en Google; servidores sin seguridad con la ubicación de personas infectadas y fallecidas por Covid-19; reportes del Centro Nacional de Epidemiología, Prevención y Control de Enfermedades (CDC) con un registro inconsistente de cifras o con errores de cálculo en suma de columnas; y desfase entre cifras de casos confirmados y fallecidos.

Salud con lupa conversó con el científico computacional Ragi Burhum, integrante del equipo, sobre las alertas que han emitido sobre la información que producen instituciones del Ministerio de Salud y sus propuestas para corregir los errores encontrados.

ragi-burhum.jpeg
Ragi Burhum, miembro del equipo de voluntarios de Open Covid-Perú.

A la fecha, los reportes del Sistema Nacional de Defunciones (Sinadef) permiten estimar más de 102 mil muertes por efecto de la pandemia. Sin embargo, el Ministerio de Salud (Minsa) y las Direcciones Regionales de Salud (Diresa) registran entre 41 mil y 57 mil muertes. ¿Cómo se explica que hasta ahora no haya claridad en el Gobierno sobre la cifra de fallecidos?

Entiendo que la cifra de fallecidos es de interés público, pero no creo que sea la cifra más importante en este momento. Si hablamos de cifras de muertes, es más importante saber las cifras diarias, compararlas con las del día anterior y la cantidad de casos positivos por cada 100 mil habitantes.

Cuando nosotros en Open Covid hablamos de cifras, estamos hablando más de los indicadores sanitarios que me dicen cuál es la situación en este momento, más que el impacto que ha tenido la pandemia en total. El impacto obviamente es importante para la ciudadanía, para saber qué es lo que ha pasado, pero en este momento en medio de la guerra, en medio de la segunda ola, es muchísimo más importante ver los valores de indicadores de hoy, para saber cuál es la situación hoy y poder tomar decisiones correctas.

¿Esos indicadores serían la disponibilidad de camas, de oxígeno?

Idealmente, serían esos. El presidente Sagasti cuando hizo el anuncio de que iban a implementar el semáforo epidemiológico, especificó cinco indicadores: tres sanitarios-epidemiológicos y dos eran económicos. Eso ya es decisión del gobierno, para categorizar a una región en rojo o extremo. En el caso de los indicadores que eligió el gobierno de Sagasti, es el número reproductivo efectivo (Rt), que dice si está creciendo o bajando la pandemia; la positividad PCR, que te dice de todas las pruebas que está usando cuántas salen positivas; y la tasa de mortalidad por 100 mil habitantes, que te dice cuál es el impacto.

Tú lo has mencionado, ¿deberíamos tener un indicador del sistema hospitalario? Mi respuesta es sí. ¿Está entre los indicadores que se mencionaron cuando se planteó la medida del semáforo epidemiológico? No lo está.

¿Qué objetivo tiene la carta que enviaron al presidente Sagasti?

Uno, pedir con mucho respeto a nuestro presidente los resultados de los indicadores que su gobierno ha elegido. Que nos diga cuáles son los valores ayer, cuáles son los valores hoy, eso es importante. Y dos, también los valores, los rangos, las metodologías que te ponen en una categoría y no en otra.

Yo no puedo decir “ahora estás en extremo” sin explicar por qué o cuándo cambia de uno a otro. Esas son preguntas básicas y esenciales. Más allá del sinceramiento de cifras, que también es importante, lo que acabo de mencionar es urgente.

En la carta mencionan que el reporte que recibe a diario el presidente Sagasti es hecho a mano, no automatizado, y habría un problema si se está basando en esa información para tomar decisiones.

Claro, esos reportes hechos a mano, cuando tienes 85 páginas que salen del CDC, lamentablemente no están automatizados. Ahí hay una ventana para que exista un error. Nosotros que vemos los reportes a diario, siempre vemos errores que dicen -claramente- que hay un problema manual.

Mira, el ser humano se equivoca, se entiende. Lo que no se entiende es porqué esos reportes no son automatizados. Cuando alguien se equivoca con esos reportes del CDC, el presidente recibe un reporte erróneo y va a tomar una decisión de índole importante para el país con datos que tienen errores.

carta open covid-perú 1.jpg
Documento enviado por el equipo de Open Covid-Perú al presidente de la República, Francisco Sagasti.

Llama la atención que desde el mismo CDC no se noten y corrijan esos errores.

Claro, la gente que mira los datos abiertos y hace sus reportes en general lo notamos, pero nosotros no tenemos ningún poder de decisión. Somos ciudadanos como otras personas. Lo preocupante es que esos problemas en los reportes son comunes y muchos de nosotros los hemos notado, pero no sé por qué el gobierno no ha hecho nada al respecto.

Desde el inicio de la pandemia se vienen señalando errores similares, ¿anteriormente han recibido alguna respuesta?

En general han habido varias instancias donde han habido problemas. En algunas de ellas hemos reportado en silencio y se han reparado. En varias otras, no. Y digamos, la acumulación de errores ha llegado al punto donde ya no se trata que Open Covid-Perú. Aparte del trabajo que hacemos, no podemos estar generando informes constantes de errores, se trata de que el gobierno haga su trabajo.

Una de las cosas que solicitan en la carta es una auditoría por parte de la Contraloría General de la República, ¿cómo esperan que se lleve a cabo?

Nosotros consultamos con varios abogados y esa fue la recomendación. La idea es que la Contraloría lleve un equipo técnico y revisen los procesos y las automatizaciones, y por qué no se han hecho automatizaciones de varios de esos procesos desde el comienzo de la pandemia. Parece razonable pensar que al comienzo de la pandemia había procesos que no estaban automatizados, pero es bastante irresponsable que estos procesos sigan así un año después.

Estos problemas vienen de antes, pero con la pandemia se hacen más graves

Varios de estos problemas tienen solución con una semana o dos semanas de trabajo. Estamos en febrero, y la pandemia empezó el año pasado en marzo. Es demasiado tiempo, no es posible. El proceso es demasiado informal.

¿Qué países en la región tienen implementado un sistema de información que podría servir como referencia para Perú?

México, Colombia, Chile, todos los países. Habría que encontrar uno que no tenga.

¿Qué países en la región tienen mejor implementado su sistema de datos? Integrado, automatizado, que permita reportar con menos errores.

Casi todos, mira el ejemplo de México, Colombia, Argentina. Chile estaba teniendo bastantes errores al comienzo, pero ahora ya lo tienen mejorado. En realidad es más difícil pensar en cuál no lo tiene.

En general, la estrategia de un mapa epidemiológico con cuarentena focalizada es normal, se hace en todos lados. La idea no es que no haya cuarentena, sino transparentar y tomar el proceso formalmente. No hacer algo que tiene tanto impacto para la población de manera ligera.

Habiendo tantos referentes para Perú, ¿cómo se explica que no hayan cambios?

El problema es la poca prioridad que se le ha dado a los sistemas informáticos en general. Te doy un ejemplo, algo que muchos no saben, pero tal vez sea interesante. Cuando tú tienes una ficha epidemiológica, tienes que poner la información en tres distintos sistemas: uno es Notiweb, el otro es SISCOVID y el otro es NETLAB. Y ¿qué es lo que sucede? Hay información duplicada que tienes que poner dos veces en dos sistemas distintos, porque una ficha va a ir a una institución, al CDC, y la otra ficha va a ir al Instituto Nacional de Salud (INS), etc. Se ha tenido que crear un tercer sistema porque no habían datos específicos para el Covid y no podían extender uno de los otros.

Entonces, hay un desorden, un desorden tecnológico. Y eso, de nuevo, se permite hace un año pero no ahora. Alguien es responsable por eso, y dentro del problema está el Minsa. No podemos seguir en una situación donde el presidente está recibiendo reportes hechos a mano, con errores.

Sumándose a los problemas con el registro, están también las brechas de seguridad. No solamente con datos personales de los ciudadanos, también con datos internos del gobierno.

Sí claro, eso es algo también que ha sido muy común desde el último año. Buscas un PDF, haces click en diferentes links del gobierno y encuentras errores tecnológicos básicos de seguridad. Encuentras datos que no deberían ser públicos, encuentras información que no debería ser tomada tan a la ligera. Y ahí hablamos de información personal. En la carta al presidente hemos enviado unos anexos que no hemos hecho públicos, pero enseñan bastantes ejemplos de problemas en el manejo de data privada de manera negligente.

En marzo del año pasado, Salud con lupa alertó la baja seguridad digital de la plataforma del INS para buscar los resultados de pruebas moleculares. En ese caso, bastaba poner el DNI de un usuario para acceder a sus datos privados.

Nosotros tenemos leyes de protección de datos. Si yo le doy mis datos personales a un banco y ellos van y lo manejan mal, publican mi información personal en un servidor público, yo los puedo enjuiciar. Por la violación de derechos de mis datos personales y por la negligencia. Y no solo los enjuicio, también me puedo llevar todos mis datos a otro banco y ese otro banco tiene la responsabilidad de resguardar mis datos que le estoy dando.

Con el gobierno es distinto, tú no tienes la opción de no darle tu información. Tú le tienes que dar y el gobierno tiene la responsabilidad de manejar esa información de la mejor manera posible. Cuando se insiste en la clase de errores que estamos viendo, existe una negligencia no cuestionable. Es una negligencia clara de cómo se están manejando los datos, y una informalidad terrible. Ese es uno de los puntos que estamos enfatizando en nuestra carta. ¿Quién es responsable? Eso lo tiene que determinar el Minsa. El Minsa tiene que aceptar un problema grave en cómo se están manejando estos datos.

Antes mencionaba que si se atiende el pedido de la auditoría por parte de la Contraloría, tomaría entre dos o tres semanas mejorar el sistema de información...

Sí, ni siquiera dos semanas. En una semana ya pueden corregir bastantes de los errores.

¿Es tan sencillo?

Es un proceso de automatización. Tenemos información que viene de distintas bases de datos, información que viene algunas veces en PDF, o de diferentes sistemas electrónicos. Para cada uno de esos, existen tecnologías que te dejan combinar desde Excels a SQL servers, a oracles, a PDF. Sea cual sea el input que tienes, hay tecnologías que te dejan combinar todos esos diferentes formatos para tener una sola base de datos consolidada. Luego escribes código para extraer y generar los reportes de esa base de datos consolidada. Entonces, la tecnología para mezclar esas cosas existe hace más de una década; hay muchos proyectos de código libre que te permiten hacer ese tipo de cosas. Simplemente no se ha hecho.

Entonces, habría una falta de acción por parte del gobierno

Falta de iniciativa y falta de comprender el impacto que tiene no hacer ese tipo de trabajos.

Hay también un tema de transparencia, para que como ciudadanos podamos conocer los motivos que han basado las decisiones.

Las decisiones tienen que estar basadas en datos. Es inaceptable para mí tener datos que no son correctos por gusto, porque sí se puede hacer y ya ha pasado mucho tiempo. No entiendo honestamente cuál es la razón de que se haga de esta manera. No existe perdón para ir y copiar datos personales de una persona en un servidor que no está encriptado, simplemente porque es más fácil dar la información de una persona a otra persona. Eso está mal.

Una respuesta de la ministra de Salud

Pilar Mazzetti_Open Covid Perú.png

Este miércoles, la carta que Open Covid-Perú dirigió al presidente Francisco Sagasti fue derivada a la Presidencia del Consejo de Ministros. Ese mismo día, Pilar Mazzetti, ministra de Salud, respondió en conferencia de prensa a una pregunta sobre la carta y el cuestionamiento a la falta de automatización de datos de la pandemia.

Salud con lupa reproduce la respuesta de la ministra:

“Efectivamente, la Presidencia de la República ha recibido una carta donde se hace una serie de observaciones. El día de hoy ya nos han transferido todos los anexos donde están los detalles de las observaciones, hay inclusive más observaciones de las que mencionan, y vamos a hacer un análisis de esto. Desde ya les puedo decir que los sistemas que tenemos son plataformas informatizadas: tenemos el Noti, el NETLAB, el SISCOVID, todas son plataformas que están informatizadas. De tal manera que la información nos llega en la medida que se va produciendo.

Sí hay, es cierto, y lo hemos dicho muchas veces, que existen dificultades en la operación en particular con las regiones porque no necesariamente su sistema es del todo compatible. Ustedes saben que lo ideal sería que tengamos unidad en las plataformas, de tal manera que todo el mundo opere con sistemas que sean abiertos, que todos los sistemas sean interoperables desde el momento en que se estructuran y que el Estado sea el dueño de la fuente, al mismo tiempo que el Estado sea dueño de la data, por la protección de datos personales que es tan importante en estos casos. Lo ideal sería que sea así, pero sí sucede que algunas veces es difícil. En algunas regiones ya esto se ha ido mejorando poco a poco desde el año pasado, que se pueda exportar la data y hacer el análisis en un tiempo mucho más rápido.

Vamos a analizar el contenido que nos ha indicado la Presidencia el día de hoy, nos ha transferido toda la información, los anexos son bastante voluminosos, para poder hacer un análisis detallado. Desde el año pasado ya inclusive estamos haciendo actualizaciones diarias, recuerden que antes eran cada quince días. Ahora ustedes ven aparecer tantos datos de tales días en la hoja que publicamos todos los días. Más aún, aquellos que tengan interés en más información, pueden acceder a través de la página web del Centro de Control de Enfermedades a la Sala Situacional que tiene no sé cuántas láminas, como 60 láminas que algunas vez el Consejo de Ministros hemos tenido que sufrir, donde hay información, por ejemplo, también del Sinadef que es otro sistema informático que nos permite ver los fallecidos con prueba, los fallecidos con sospecha clínica - un rubro que no había antes y a raíz de las observaciones del año pasado ya lo tenemos- y el total de fallecidos por Covid-19. De tal manera que vamos a analizar qué implica esta carta y vamos a hacer el análisis que competa. Y si algo hay que mostrar, se mostrará con toda transparencia”.

Más en Entrevistas

Más en Salud con lupa