¿Es la herramienta de IA DALL-E 2 una amenaza para los artistas?

El sistema DALL-E 2 de segunda generación de OpenAI se está abriendo lentamente al público, y sus capacidades de edición y generación de imágenes basadas en texto son impresionantes.

 

¿La has probado? DALL·E 2 es el modelo de inteligencia artificial más nuevo de OpenAI. Si has visto algunas de sus creaciones y crees que son increíbles, tienes toda la razón.

OpenAI publicó una entrada en su blog oficial y un documento titulado "Generación de imágenes condicionales de texto jerárquico con latentes CLIP" en DALL·E 2. El documento es excelente para comprender los detalles técnicos pero ninguno explica lo asombroso de DALL·E 2, y lo no tan asombroso, en profundidad.

A pesar de su tamaño, DALL·E 2 genera imágenes con una resolución cuatro veces mejor que DALL·E y es el preferido por los jueces humanos en un 70 % de las veces, tanto en coincidencia de subtítulos como en fotorrealismo.


DALL-E 2 puede incluso modificar imágenes existentes, crear variaciones de imágenes que mantengan sus características sobresalientes e interpolar entre dos imágenes de entrada. Los impresionantes resultados de DALL-E 2 hacen que muchos se pregunten exactamente cómo funciona bajo el capó un modelo tan potente.

 


¿Cómo genera imágenes?

Si bien DALL-E 2 puede realizar una variedad de tareas, incluida la manipulación e interpolación de imágenes como se mencionó anteriormente, en este artículo nos centraremos en la tarea de generación de imágenes y su eco en el mundo real.

La representación mental codifica las principales características que son semánticamente significativas: personas, animales, objetos, estilo, colores, fondo, etc. para que DALL·E 2 pueda generar una imagen novedosa que retenga estas características mientras varía las características no esenciales.

dall2
OPENAI PROJECT

DALL-E 2 representa un cambio radical en la tecnología de generación de imágenes de IA. Comprende las indicaciones del lenguaje natural mucho mejor que cualquier otro anterior, lo que permite un nivel de control sin precedentes sobre temas, estilos, técnicas, ángulos, fondos, ubicaciones, acciones, atributos y conceptos, y genera imágenes de una calidad extraordinaria.

Con alta calidad, genera docenas de opciones en segundos, cada una con un nivel de calidad que le llevaría horas producir a un fotógrafo, pintor, artista digital o ilustrador humano. Es una especie de sueño de director de arte.


OpenAI dice explícitamente que los usuarios "obtienen todos los derechos para comercializar las imágenes que crean con DALL-E, incluido el derecho a reimprimir, vender y comercializar". Pero todavía existen algunas áreas grises legales que aún no se han explorado completamente.

¿Cuánto tiempo pasará antes de que veamos un cortometraje completo, escrito, dirigido, con banda sonora y hecho completamente por sistemas de IA? ¿Cómo será entonces el futuro para los artistas?

 


Referencia: OPENAI PROJECT

Sarah Romero

Sarah Romero

Fagocito ciencia ficción en todas sus formas. Fan incondicional de Daneel Olivaw y, cuando puedo, terraformo el planeta rojo o cazo cylons. Hasta que viva en Marte puedes localizarme en Twitter: sarahromero_ y en ladymoon@gmail.com

Continúa leyendo