Soy médico, pero hoy mi profesión es analista de datos. Esta transición fue gradual. Ejercía la clínica con una presencia cada día más exigente de los ordenadores. Cada vez tenía que introducir más información sobre los pacientes, pero estaba poco convencido de que ese sistema me “devolviese” lo suficiente. Hoy accedo a datos de millones de pacientes con el fin de entender sus diagnósticos y pronósticos. Para explicar mi trabajo necesito describir lo que son los datos médicos, cómo representan la salud de cada persona, cómo se estudian. Sin embargo, acceder a estos datos tan personales entraña riesgos. Y esos riesgos deben compararse con los beneficios, para uno mismo y para los demás.

Los datos médicos incluyen todo lo que nos imaginamos y más: diagnósticos, intervenciones médicas y quirúrgicas, tratamientos; pero también los datos demográficos (edad, género, domicilio... y en muchos países, el origen y la raza) y el número de identidad. Y, cada vez más, los datos médicos pueden contener texto completo, como las notas médicas o de enfermería, el seguimiento en el tiempo y la información sobre otros miembros de la familia. Con estos datos se construye una identidad numérica. El uso “secundario” de datos médicos solo ocurre tras un proceso de anonimización.

Esa identidad numérica pueden definirnos con gran precisión. La traducción inmediata de esta precisión se puede describir como n=1: somos únicos y por ello quizá nos beneficiaríamos de un tratamiento individualizado. Sin embargo, lo más interesante es que la identidad numérica de cada paciente permite la búsqueda del conjunto de pacientes que más se parecen “numéricamente” y de quienes podemos aprender la evolución de la enfermedad e identificar el mejor tratamiento. Ser único no va a ayudarte; ser parecido a otros, sí.

Es cierto que los médicos siempre han estudiado colectivos de pacientes que comparten diagnóstico. Lo que ha cambiado es el acceso a bases de datos masivas. Los datos de hospitales y de farmacias son hoy –sorpresa– un producto que tiene un gran valor económico y a los que se accede a través de un mercado establecido desde hace décadas. Este mercado y sus procesos están regulados, pero también están sujetos a cambios rápidos en el contexto legal. Estos cambios reflejan tanto las nuevas exigencias en el nivel de protección y autonomía del paciente, como la amenaza a la anonimización de los datos por nuevas tecnologías de computación.

Para entender el riego de este mercado de datos, hay que pensar en otros campos comerciales que concentran datos importantes sobre nosotros; por ejemplo, las compañías de seguros o los bancos. Los riesgos de reidentificación y de uso inapropiado deben ser puestos en la balanza junto con la utilidad que puedan tener para uno mismo (puesto que nos beneficiaríamos de los datos de los demás para mejorar nuestro manejo médico), y junto con los avances en investigación y en el desarrollo de nuevos medicamentos. Quiero ilustrar estos puntos con alguna de las experiencias que he tenido trabajando en este campo.

En 2019, me basé en decenas de miles datos de más de 2.400 personas acumulados durante más de una década para identificar varios tipos de obesidad. La observación más importante fue que un grupo de individuos, aún siendo delgados, padecían con el paso de los años las mismas dolencias (enfermedad cardiovascular, trastornos del metabolismo y diabetes) que los individuos obesos. Paradójicamente, también identificaba personas obesas que tenían la evolución que asociamos a personas con un peso normal. Este tipo de observaciones son hoy más fáciles gracias a la exploración de datos masivos y pueden resultar en tratamientos más precisos.

Más recientemente, en 2022, pude analizar los datos médicos de más de 100.000 niños con covid. Este volumen de datos permitió una precisión elevada en la identificación de los niños que serían hospitalizados y aquellos que, una vez hospitalizados, desarrollarían las complicaciones más graves. Estos tipos de algoritmos son ahora considerados herramientas futuras en la respuesta a epidemias y pandemias. Ponerlas en uso implicaría “insertar” los algoritmos predictivos en el sistema de manejo de datos de los sistemas de salud. Al mismo tiempo, no me he olvidado de los riegos, y he podido trabajar junto a ingenieros de computación en sistemas avanzados de encriptado de datos médicos (en particular, de aquellos que conciernen a los datos genéticos).

Soy consciente de que, para mucha gente, la sensación de amenaza al ver los datos médicos personales expuestos es mayor que las ventajas aparentes. Sin embargo, la sociedad está creando una dependencia real en la utilización de datos en todos los campos imaginables. Aceptar esta nueva realidad significa mantenerse optimista respecto a los beneficios para la salud y una atención a las herramientas tecnológicas, éticas y legales que afiancen su protección.

Amalio Telenti se graduó en Medicina en la Universidad de Oviedo. Ejerció de médico e investigador en la Clínica Mayo (EE UU) y en las Universidades de Berna y Lausana (Suiza). Desde 2014, trabaja en la industria, en el análisis de datos genómicos, moleculares y clínicos para el desarrollo de fármacos.