La inteligencia artificial está aprendiendo lo que significa tener vida

En 1889, un médico francés llamado Francois-Gilbert Viault bajó de una montaña de los Andes, se extrajo sangre del brazo y la analizó bajo el microscopio. Sus glóbulos rojos, los cuales se encargan de transportar oxígeno, habían aumentado 42 por ciento. Había descubierto que el cuerpo humano tenía un poder misterioso: cuando necesita tener más de estas células fundamentales, puede fabricarlas según las requiera.

A principios del siglo XIX, los científicos plantearon la teoría de que la causa era una hormona. A esta hormona teórica le llamaron eritropoyetina, que significa “productora de glóbulos rojos” en griego. Siete décadas después, los investigadores descubrieron la verdadera eritropoyetina después de filtrar 2536 litros de orina.

Con algunos datos ocultos sobre los genes y las células, los modelos de inteligencia artificial han hecho algunos descubrimientos asombrosos. ¿Qué podrían llegar a enseñarnos algún día? (Doug Chayka/The New York Times)
Con algunos datos ocultos sobre los genes y las células, los modelos de inteligencia artificial han hecho algunos descubrimientos asombrosos. ¿Qué podrían llegar a enseñarnos algún día? (Doug Chayka/The New York Times)

Y cerca de 50 años después de eso, los biólogos de Israel anunciaron que habían encontrado una célula renal poco común que fabrica esa hormona cuando el oxígeno desciende demasiado. La nombraron célula Norn en honor a las deidades nórdicas que, según se creía, controlan el destino de la humanidad.

Los seres humanos tardaron 134 años en descubrir las células Norn. El verano pasado, las computadoras de California las descubrieron en solo seis semanas.

El descubrimiento ocurrió cuando los científicos de la Universidad de Stanford programaron las computadoras para que ellas mismas se enseñaran biología. Estas computadoras corrían un programa de inteligencia artificial parecido al ChatGPT, el popular bot que ha llegado a manejar el lenguaje con fluidez después de haberse entrenado con millones de textos obtenidos del internet. Pero los investigadores de esta universidad entrenaron sus computadoras con datos sin procesar acerca de millones de células reales y su composición química y genética.

Los investigadores no les dijeron a las computadoras lo que significaban estas mediciones; tampoco les explicaron que los diferentes tipos de células tienen diferentes perfiles bioquímicos. No definieron, por ejemplo, qué células captan la luz en nuestros ojos, ni cuáles fabrican anticuerpos.

Las computadoras desentrañaron los datos por sí mismas y crearon un modelo de todas las células con base en el parecido de unas con otras en un espacio enorme y multidimensional. Cuando las máquinas terminaron, ya habían aprendido muchísimo. Pudieron clasificar una célula que nunca antes habían visto como una entre 1000 tipos diferentes. Una de ellas fue la célula Norn.

“Eso es muy extraordinario debido a que nadie le dijo jamás al modelo que las células Norn estaban en el riñón”, comentó Jure Leskovec, un informático de la Universidad de Stanford que entrenó a las computadoras.

Este software es uno de los muchos programas nuevos impulsados por inteligencia artificial que se conocen como modelos fundacionales y que están poniendo su mira en los aspectos fundamentales de la biología. Los modelos no solo están ordenando la información que los biólogos recaban, sino que están realizando descubrimientos acerca de cómo funcionan los genes y cómo se desarrollan las células.

A medida que aumenten los modelos, con cada vez más datos de laboratorio y capacidad informática, los científicos prevén que comenzarán a llevar a cabo descubrimientos más profundos. Es posible que descubran secretos sobre el cáncer y otras enfermedades y podrían idear recetas para convertir un tipo de célula en otro.

“Creo que en cierto momento veremos algún descubrimiento fundamental sobre la biología que, de otra manera, los biólogos no hubiesen realizado”, señaló Eric Topol, director del Scripps Research Translational Institute.

Qué tan lejos se llegará sigue siendo tema de debate. Aunque algunas personas escépticas creen que los modelos tendrán un final, los científicos más optimistas piensan que los modelos fundacionales abordarán incluso la pregunta más grande de la biología: ¿Qué separa la vida de lo que no es vida?.

Las células cardiacas y las ratas topo

Desde hace mucho tiempo, los biólogos han querido entender la manera en que las diferentes células del cuerpo usan los genes para hacer muchas cosas que necesitamos con el fin de mantenernos vivos.

Hace aproximadamente una década, los investigadores comenzaron a realizar experimentos a escala industrial para buscar fragmentos genéticos procedentes de células individuales. Los científicos registraron lo que hallaron en catálogos o “atlas celulares”, los cuales se llenaron de miles de millones de datos.

Christina Theodoris, una médico residente en el Hospital Infantil de Boston, estaba leyendo acerca de un nuevo tipo de modelo de inteligencia artificial fabricado por los ingenieros de Google en 2017 para traducciones lingüísticas. Los investigadores alimentaron el modelo con millones de oraciones en inglés, junto con su traducción al alemán y al francés. El modelo desarrolló la capacidad de traducir oraciones que nunca antes había visto. Theodoris se preguntó si un modelo similar podría enseñarse a sí mismo a interpretar los datos de los atlas celulares.

En 2021, no podía encontrar un laboratorio que le permitiera tratar de construir uno. “Había mucho escepticismo de que este método funcionara”, comentó.

Shirley Liu, una bióloga computacional en el Instituto para el Cáncer Dana-Farber en Boston, le dio una oportunidad. Theodoris extrajo datos de 106 estudios en seres humanos que habían sido publicados, los que, en su conjunto, incluían 30 millones de células e introdujo todo en un programa llamado GeneFormer.

El modelo alcanzó un conocimiento profundo de la manera en que se comportan nuestros genes en las diferentes células. Por ejemplo, este predijo que apagar un gen llamado TEAD4 en un cierto tipo de célula cardiaca la afectaría de manera considerable. Cuando su equipo puso a prueba esta predicción en células reales llamadas cardiomiocitos, la pulsación de las células cardiacas se debilitó.

En otra prueba, Theodoris y sus colegas le mostraron a GeneFormer células del corazón tanto de personas con ritmos cardiacos deficientes como de personas sanas. “Luego le pedimos que nos dijera qué modificaciones hay que hacerles a las células enfermas para poder sanarlas”, explicó Theodoris, quien ahora trabaja en la Universidad de California, campus San Francisco.

GeneFormer recomendó disminuir la actividad de cuatro genes que nunca antes se habían asociado con cardiopatías. El equipo de Theodoris siguió el consejo del modelo y eliminó cada uno de los cuatro genes. En dos de los cuatro casos, el tratamiento mejoró la manera en que las células se contraían.

El equipo de la Universidad de Stanford entró al negocio de los modelos fundacionales después de ayudar a construir una de las bases de datos de células más grandes del mundo, conocida como CellXGene. Desde el mes de agosto, los investigadores entrenaron a sus computadoras con 33 millones de células de esa base de datos y se concentraron en un tipo de información genética llamada ARN mensajero. También alimentaron el modelo con estructuras tridimensionales de proteínas, que son el producto de los genes.

A partir de estos datos, el modelo (conocido como integración celular universal, o UCE, por su sigla en inglés), calculó la similitud entre las células y las agrupó en más de 1000 grupos de acuerdo con la manera en que usaban sus genes. Los grupos correspondían a tipos de células descubiertas por varias generaciones de biólogos.

El UCE también se enseñó a sí mismo algunas cosas importantes sobre cómo las células se desarrollan a partir de un solo óvulo fecundado. Por ejemplo, el modelo reconoció que todas las células del cuerpo pueden agruparse dependiendo de cuál de las tres capas salieron en la fase inicial del embrión.

“Prácticamente volvió a descubrir la biología del desarrollo”, señaló Stephen Quake, un biofísico de la Universidad de Stanford que ayudó a desarrollar el UCE.

El modelo también fue capaz de transferir su conocimiento a nuevas especies. Cuando se le proporcionó el perfil genético de las células procedentes de un animal que nunca antes había visto (por ejemplo, una rata topo desnuda), el UCE pudo identificar muchos de sus tipos de células.

“Se puede traer un organismo totalmente nuevo (pollo, rana, pez, o lo que sea), introducirlo y obtener algo útil de ello”, señaló Leskovec.

Después de que el UCE descubrió las células Norn, Leskovec y sus colegas ingresaron a la base de datos CellXGene para ver de dónde habían venido. Aunque muchas de las células habían provenido de los riñones, algunas habían procedido de los pulmones y de otros órganos. Los investigadores especularon que era posible que células Norn antes desconocidas estuvieran esparcidas por todo el cuerpo.

Katalin Susztak, una médico investigadora en la Universidad de Pensilvania que estudia las células Norn, mencionó que el hallazgo despertó su curiosidad. “Quiero revisar esas células”, comentó.

Susztak no cree que el modelo haya encontrado células Norn verdaderas afuera de los riñones debido a que no se ha encontrado la hormona eritropoyetina en otros lugares. Pero las nuevas células podían sentir el oxígeno como lo hacen las células Norn.

En otras palabras, es posible que el UCE haya descubierto un nuevo tipo de célula antes que los biólogos.

Un ‘internet de células’

Al igual que el ChatGPT, los modelos biológicos también se equivocan. Hace poco, Kasia Kedzierska, una bióloga computacional de la Universidad de Oxford, y sus colegas les dieron a GeneFormer y a otro modelo fundacional, el sgGPT, una serie de pruebas. Les presentaron atlas celulares que nunca antes habían visto y los pusieron a realizar tareas como clasificar las células en tipos. Los modelos hicieron bien algunas tareas, pero en otros casos tuvieron un mal desempeño en comparación con programas computacionales más simples.

Kedzierska comentó que tenía mucha esperanza en los modelos, pero que, por el momento, “no deben usarse así como así sin que se tenga un conocimiento adecuado de su limitaciones”.

Leskovec mencionó que los modelos estaban mejorando a medida que los científicos los entrenaban con más datos. Pero en comparación con el entrenamiento que recibió el ChatGPT con datos de todo el internet, los últimos atlas celulares solo brindan una cantidad reducida de información. “Me gustaría tener todo un internet de células”, comentó.

A medida que atlas celulares más grandes lleguen al internet, habrá más células. Además, los científicos están recolectando diferentes tipos de datos de cada una de las células de esos atlas. Algunos científicos están clasificando las moléculas que se adhieren a las células o tomando fotografías de las células para ilustrar la ubicación precisa de sus proteínas. Toda esa información permitirá que los modelos fundacionales saquen conclusiones acerca de qué hace que las células funcionen.

Los científicos también están desarrollando herramientas que permitan que los modelos fundacionales combinen lo que están aprendiendo por su cuenta con lo que han descubierto los biólogos de carne y hueso. La idea sería relacionar los hallazgos de miles de artículos científicos publicados con las bases de datos de las mediciones de células.

Los científicos afirman que con datos suficientes y capacidad informática es posible que con el tiempo generen una representación matemática completa de la célula.

Quake sospecha que los modelos fundacionales no solo aprenderán sobre los tipos de células que habitan actualmente en nuestro cuerpo, sino también acerca del tipo de células que podrían

“Creo que estos modelos nos ayudarán a llegar a un entendimiento en verdad fundamental de la célula, lo que nos dará una cierta idea de lo que es realmente la vida”, aseveró Quake.

Tener un mapa de lo que es posible e imposible para sustentar la vida quizá también signifique que los científicos puedan, de hecho, generar células nuevas que no existen en la naturaleza. El modelo fundacional podría ser capaz de elaborar recetas químicas que transformen las células comunes y corrientes en células nuevas y extraordinarias. Esas nuevas células podrían engullir la placa de los vasos sanguíneos o explorar un órgano enfermo e informarnos sobre su gravedad.

“Es como un gran ‘Viaje Fantástico’”, reconoció Quake. “Pero quién sabe lo que nos deparará el futuro”.

c.2024 The New York Times Company

TAMBIÉN TE PUEDE INTERESAR | EN VIDEO

Robot humanoide de Figure es capaz de tener conversaciones y razonar gracias a la IA