RoboRXN, un robot con IA para acelerar el descubrimiento de materiales en la industria química

IBM ha desarrollado un robot con inteligencia artificial que es capaz de acortar drásticamente el tiempo que se tarda habitualmente en descubrir nuevos materiales químicos. ¿Podría servir para descubrir con más celeridad tratamientos contra la COVID-19?

RoboXn de IBM
IBM

Para la mayoría de los mortales, la química es un recuerdo lejano de la infancia que se remonta a nuestros días escolares, donde pudimos experimentar con reacciones químicas. Pero la química está en todas partes y juega un papel esencial en los productos y tecnologías sin los que probablemente no podamos imaginar vivir.

Sin embargo, lo que la mayoría de nosotros quizás no nos damos cuenta es que, en promedio, se necesitan al menos 10 años para descubrir un nuevo material y llevarlo al mercado, y los costos de producción estimados son de alrededor de 10 millones de dólares. La investigación sobre el nylon, por ejemplo, comenzó en 1927 y se utilizó por primera vez en un cepillo de dientes en 1938.
 
La química sintética o el arte de fabricar materiales sigue siendo la disciplina más tradicional en términos de digitalización y adquisición de nuevas tecnologías. Los químicos todavía se basan en muchos de los mismos protocolos de hace décadas y se ha avanzado poco en la modernización de las antiguas prácticas de prueba y error para permitir una nueva era de descubrimiento acelerado. Y es en este punto en el que que entran en escena un grupo dinámico de científicos de IBM Research Europe, que se propuso cambiar estos protocolos anteriormente citados utilizando herramientas modernas como la inteligencia artificial (IA), la tecnología de computación en la nube y la robótica.

Los científicos de IBM

Todo comenzó hace tres años cuando en IBM Research se empezaron a desarrollar modelos de aprendizaje automático para predecir reacciones químicas. Después de unos meses de desarrollo interno se lanzó un servicio gratuito, a través de IBM Cloud, que llamaron RXN para química y que es un método de traducción de aprendizaje automático neuronal de última generación que puede predecir el resultado más probable de una reacción química utilizando arquitecturas de traducción automática neuronal. De forma similar a la traducción del italiano al inglés, nuestro método traduce el lenguaje de la química convirtiendo reactivos y reactivos en productos, utilizando la representación SMILE para describir entidades químicas.
 
En 2019 los científicos de IBM Research Europe comenzaron a colaborar con un grupo de químicos orgánicos sintéticos en la Universidad de Pisa, Italia, para integrar una arquitectura retrosintética en la herramienta RXN. Para explicarlo pensaron en hacer una pizza. La arquitectura retrosintética indica los ingredientes de la pizza y también proporciona pautas de alto nivel para crearla en el orden correcto. Trabajando con el equipo en Pisa, agregaron esta función a RXN for Chemistry en octubre pasado.

¿Cómo hacer que la química sea divertida de nuevo?

Los investigadores de IBM creen que la forma de hacerlo es repensar la química por completo combinando la IA, la tecnología en la nube y la automatización química. Esta mezcla condujo a la creación de RoboRXN: algoritmos de aprendizaje automático que diseñan y ejecutan de forma autónoma la producción de moléculas en un laboratorio accesible de forma remota con la menor intervención humana posible.
 
El principal desafío en química es que muchos detalles operativos, como "cocinar" una pizza, se hacen en forma de datos no estructurados, lo que frustra un análisis e interpretación sencillos. Para poder construir un modelo de IA con la capacidad de aprender los pasos correctos de los procedimientos químicos, los científicos de IBM diseñaron un algoritmo que extraía específicamente la información de síntesis para la química orgánica y la convertía en una estructura automatizada y en un formato amigable.

RoboXN y química
IBM

Esquema basado en datos

Una vez que el algoritmo de aprendizaje automático adquiere suficientes ejemplos, puede descubrir por sí mismo a qué palabras prestar atención para extraer los pasos de producción correctos. Para proporcionar los datos de entrenamiento para el modelo de aprendizaje automático se creó un marco de anotación que permitió generar ejemplos de oraciones relacionadas con los procedimientos de síntesis y las operaciones correspondientes. La principal ventaja de este enfoque, basado en datos, es que se basa en datos solamente. Para mejorarlo, simplemente se necesitan más ejemplos.
 
A diferencia de otros enfoques, el modelo de aprendizaje profundo convierte los procedimientos experimentales en su conjunto en un formato estructurado y fácil de automatizar, en lugar de escanear textos en busca de información relevante. Además, no se basa en la identificación de entidades individuales en oraciones, ni requiere especificar a qué palabras o grupos de palabras corresponden las acciones de síntesis, lo que hace que el modelo sea más flexible y confiable.

RoboRXN aprende

La construcción de un conjunto de datos fiables sobre el terreno para los procedimientos químicos permitió a los expertos de IBM construir el núcleo de la tecnología RoboRXN, a saber, un modelo de IA que, entrenado en una gran cantidad de recetas químicas, aprende los detalles de los químicos para poder recomendar la secuencia correcta de operaciones para " cocinar" una molécula objetivo específica. Volviendo a la analogía de la pizza: imaginemos un modelo de inteligencia artificial que no solo pueda recuperar sus recetas favoritas a pedido, sino que también puede extraer automáticamente información de su conocimiento integrado para entregar una lista óptima de instrucciones para hacer esa pizza gourmet que seguramente impresionará a los invitados a la cena.
 
En términos de TI, esto equivale a tener una arquitectura de inteligencia artificial que escriba programas para producir moléculas o cocinar alimentos. El objetivo de los científicos al construir RoboRXN era utilizar este modelo de IA para eliminar la tediosa tarea humana de programar hardware de automatización comercial. Y para que el sistema RoboRXN sea aún más conveniente y fácil de usar, se implementó todo el conjunto de servicios en IBM Cloud para que fuera accesible en cualquier lugar donde haya una conexión a Internet.
 
¿Cuáles son las implicaciones de esta invención de IBM? ¿Podría un sistema automatizado como RoboRXN ayudar a los químicos a reducir a la mitad el período de descubrimiento de un nuevo tratamiento para COVID-19 o cualquier otro virus? O ¿qué pasaría si RoboRXN pudiera ayudar a acelerar el desarrollo de un fertilizante que no requiera consumir entre el 1 % y el 2 % del suministro de energía anual del mundo para su producción?

Juan Carlos F. Galindo

Juan Carlos F. Galindo

Tras dos décadas dedicado a la comunicación de Productos y Servicios, Innovación, Tecnología, I+D, Televisión y Patrocinios de una gran empresa, me embarco en este blog que dedicaré a mi pasión, la tendencia tecnológica que va a protagonizar la 4ª Revolución Industrial: la Inteligencia Artificial.

Continúa leyendo