Antes de que se hicieran públicos los primeros casos del virus de Wuhan, la inteligencia artificial ya lo sabía. El 31 de diciembre, un algoritmo desarrollado por una start up canadiense especializada en monitorizar la dispersión de enfermedades infecciosas ya había descubierto el brote y avisado de la noticia a sus clientes, según Wired, medio de referencia en la información tecnológica. Ese mismo día, China había comunicado la existencia de 27 casos a la Organización Mundial de la Salud (OMS), aunque el organismo no anunció la existencia del brote hasta diez días después. El virus, que provoca síntomas parecidos a la neumonía, se originó posiblemente por la exposición de los vendedores a animales vivos en el mercado de mariscos de Huanan.
Una de las habilidades más extendidas de la inteligencia artificial es su capacidad para analizar cantidades ingentes de datos y encontrar patrones. Y eso es precisamente lo que hace el sistema propuesto por BlueDot, la start up que ha desarrollado el algoritmo y que se dedica a hacer informes para distintos organismos oficiales en Estados Unidos de forma sistemática desde hace años. Su estrategia para hacer una predicción sobre la dispersión del virus se basa en recopilar y analizar información de noticias publicadas en webs informativas y periódicos en más de 30 idiomas diferentes.
A través del procesamiento del lenguaje natural, que permite a la inteligencia artificial entender y producir textos, “el algoritmo lee noticias publicadas en medios locales donde se mencionan casos de gripe, muertes sin una explicación aparente y síntomas que no se ubican en un diagnóstico concreto, tanto en humanos como en animales”, explica Alfonso Valencia, profesor de la Institución Catalana de Investigación y Estudios Avanzados (ICREA) y director del departamento de ciencias de la vida en el Barcelona Supercomputing Center. “La minería de textos ha evolucionado mucho en los últimos años y se ha perfeccionado”, cuenta Valencia.
Básicamente, es un sistema para seguir las noticias en Internet sobre los casos coincidentes que vayan surgiendo. La dificultad reside en que estos algoritmos sean igual de eficientes en diferentes idiomas. “La clave de cómo lo han podido hacer es porque hay dos nuevos sistemas de traducción que son muy eficientes, basados también en machine learning, y es posible que los estén usando”. Valencia es prudente al pronunciarse porque la start up no ha dado detalles técnicos sobre el proceso. A preguntas de EL PAÍS, BlueDot asegura por correo electrónico que no puede contestar a la prensa porque está enfocada en prestar servicio a sus clientes.
Otra fuente de datos clave para anticiparse a la dispersión de la enfermedad por todo el mundo son los billetes de avión. Si se puede analizar cuántos vuelos diarios hay desde la ciudad de origen del virus al resto de ciudades del mundo, si son directos o no y cuántos viajeros los toman, puede saberse en qué otras zonas del mundo pueden darse los siguientes casos. Esta información, a la que BlueDot tiene acceso, permite saber cuándo y hacia dónde se dirigirán los residentes infectados. En este caso, el sistema de inteligencia artificial pronosticó correctamente que el virus saltaría de Wuhan a Bangkok, Seúl, Taipei y Tokio en los días posteriores a su aparición inicial. “La combinación de estas dos fuentes de información es lo que hace posible refinar la previsión de dispersión de la enfermedad”, explica Valencia.
Una vez que la inteligencia artificial ha hecho su trabajo y se completa este filtro automatizado de datos, los epidemiólogos verifican que las conclusiones tengan sentido desde un punto de vista científico, y envían un informe a funcionarios de salud pública en una docena de países, aerolíneas y hospitales de primera línea donde pueden terminar los pacientes infectados, según explica Kamran Khan, fundador y CEO de BlueDot, según recoge Wired.
Este mismo sistema ya ha demostrado ser eficiente en brotes anteriores. A BlueDot ya le funcionó hace unos años durante la epidemia del virus del Zika. En esa ocasión, su modelo utilizaba itinerarios de vuelo, mapas de temperatura, densidades de población y rangos de mosquitos transmisores del virus como fuente de información. Por ejemplo, su mapa de riesgos mostró que Florida recibía enormes volúmenes de viajeros de Brasil y tenía el clima y los mosquitos adecuados para la transmisión de la enfermedad. Sus predicciones, que resultaron acertadas, fueron publicadas por la revista médica The Lancet.
La aplicación del big data para la detección de enfermedades también ha demostrado sus limitaciones. En 2014 Google cerró Google Flu Trends, que había lanzado 2009 a bombo y platillo para predecir la incidencia de la gripe en cada región. La página pasó de calcular con exactitud los casos de gripe en EE UU, gracias a las consultas del buscador, a fallar en todos sus pronósticos. La revista Nature publicó entonces un artículo ironizando sobre la “arrogancia” de este tipo de herramientas, basadas en una acumulación masiva de datos.
El País