¿Por qué DALL-E podría cambiar el mundo?

La inteligencia artificial está creciendo a pasos agigantados y cada vez son más las herramientas y aplicaciones que la llevan a cabo de la forma más sencilla posible. Su principal objetivo es desarrollar una serie de mecanismos que consigan que la tecnología pueda crear imágenes que antes solo estaban al alcance de la mente humana.

 

Aprovechando esta tendencia, OpenAI lanzó a principios de 2021 la primera versión de Dall-e, una interesante herramienta que tiene la capacidad de crear imágenes a partir de palabras recurriendo a una potente base de datos.

El nombre de Dall-e es un acrónimo que fusiona Wall-e, la famosa película de Disney, y al pintor Salvador Dalí. Con este nombre sus creadores quieren hacer referencia a la esencia de la inteligencia artificial pero sin perder de vista que los resultados tienen un claro enfoque artístico.

Una de las características más interesantes de Dall-e es que puede generar imágenes en una gran variedad de estilos: desde emoticonos hasta pinturas o fotos realistas. También tiene la capacidad de reorganizar y manipular objetos en imágenes e incluso puede mover elementos creando nuevas composiciones sin instrucciones explícitas.

Dall-e fue presentado junto a CLIP (Contrastive Language-Image Pre-training), otra herramienta cuya misión es comprender y clasificar el resultado de Dall-e. Las imágenes que crea Dall-e están seleccionadas por CLIP, el cual las presenta con una calidad más alta.

Las imágenes generadas por DALL-E 2 han causado estupor por ver, por primera vez materializado, cómo una inteligencia artificial puede generar algo que hasta ahora se daba por terreno creativo exclusivamente humano. Antes, desde hace unos años, los textos generados en esta ocasión por GPT-3, también dejaron a muchos boquiabiertos, dando lugar a multitud de titulares hablando sobre el final de decenas de profesiones. Tras todo ello está OpenAI.

OpenAI, como entidad, es una rareza en sí misma. Un laboratorio de investigación sin ánimo de lucro sobre IA fundado y financiado por grandes nombres y compañías que, a su vez, está dentro de una compañía que sí que cuenta con vocación comercial.

OpenAI fue en origen cofundada por Elon Musk y Sam Altman, entre otros, en 2015, con la intención de trabajar por una Inteligencia Artificial amigable con el ser humano. Comenzaron con unos fondos propios y de terceros de unos 1 000 millones de dólares.

Musk es de sobra conocido, mientras que Altman ocupó durante muchos años el puesto de presidente en Y Combinator, una de las aceleradoras de startups más importantes del mundo. Altman, actualmente, ocupa el puesto de CEO en OpenAI, mientras que Musk, más alejado ahora, sigue como asesor.

Posteriormente, en 2019, Microsoft aportó otros 1 000 millones, en algo que en su momento se vio como una compra o al menos juego de influencia soterrado. En ese momento, Microsoft y OpenAI anunciaron que habían establecido una asociación exclusiva de varios años para construir la nueva tecnología de supercomputación de IA de Azure, el ecosistema en la nube de Microsoft.

En cierto modo, OpenAI ha sido vista como una rival directa de DeepMind, el laboratorio adquirido por Alphabet de origen londinense, también puntero en Inteligencia Artificial.

Con el tiempo, OpenAI Inc., su brazo comercial, ha aportado soluciones a Tesla, Facebook o la propia Microsoft y, aunque la empresa comparte abiertamente sus descubrimientos, el hecho de que desarrolle herramientas con fines lucrativos no ha estado exento de crítica.

A nivel técnico, la estrategia de OpenAI consta esencialmente de dos partes: el objetivo de conseguir capacidades avanzadas de IA y dar con el proceso para lograrlo. Para ello, trabajan con equipos distintos buscando ratificar teorías. Un equipo apuesta por la teoría de que la IA puede aprender a través del lenguaje, mientras que otro apuesta por la robótica para desarrollar la inteligencia a través del entendimiento de movimientos físicos.

A pesar de sus promesas públicas, OpenAI ha sufrido ya algún traspié que indica que su afán por el dinero está ganando cada vez más peso. Durante el desarrollo de GPT-2 se reveló que OpenAI estaba ocultando deliberadamente investigaciones que podrían ser explotadas comercialmente más adelante. A ello se suma que los accesos a sus desarrollos y sus APIs no han dejado de subir de precio.

El tiempo dirá hasta qué punto los intereses de Microsoft y de sus clientes acaban derivando la misión fundacional de OpenAI, quizá demasiado utópica de inicio, pero más por los intereses humanos que por sus capacidades de desarrollo de la IA.

Con DALL-E, OpenAI se suma a la tendencia de creación de programas y herramientas que consiguen construir imágenes con grandes bases de datos y a partir de una serie de parámetros. Estas herramientas consiguen fusionar conceptos, atributos y estilos para ofrecer al usuario una imagen acorde con su demanda.

Referencia:

OPENAI. 2022.DALL·E: Creating Images from Text. (Press Release)

Doctor Fisión

Doctor Fision

Divulgador científico especialista en física y astrofísica, y apasionado de la ciencia en general. Autor del bestseller "El Universo Explicado" y de "La Nueva Carrera Espacial". Tiene más de 3 millones de seguidores en redes sociales.

Continúa leyendo