Interpretación de árboles como pagodas que crean paisajes fantásticos

Los ingenieros de software en Google están haciendo experimentos increíbles con sistemas de inteligencia artificial para que generen sus propias interpretaciones de imágenes a partir de fotografías o simples patrones de estática.

En la maravillosa nueva película de Alex Garland, Ex-Machina, se plantea la realización de una inteligencia artificial (IA) a partir de los patrones de usuarios de un enorme motor de búsqueda. Y claro, la referencia a Google es evidente. Pues bien, más cercano a la realidad inmediata es justamente Google, donde a través de investigación en diseño de software estamos recibiendo, por primera vez, interpretaciones gráficas de lo que puede generar una inteligencia artificial al observar una imagen.

Todo el asunto se desarrolla por capas: se alimenta la información de la IA con diferentes formas relacionadas con objetos de nuestro mundo hasta que es capaz de reconocer una cierta cantidad de ellos en cualquier imagen. Las primeras aplicaciones para este tipo de tecnología son, claro está, las de vigilancia en cámaras para identificar rostros u objetos buscados. Y bueno, las computadoras comenzaron a aprender, con cierto grado de errores a interpretar imágenes al azar. Pero los investigadores de Google quisieron ir aún más lejos.

Google-IA-07
Interpretación de pixeles aleatorios según una idea específica, plátano, estrella de mar u hormiga, por ejemplo.

Ya que la máquina es capaz de reconocer cierto número de patrones, le piden que identifique un grupo de objetos en particular en una imagen de puros pixeles aleatorios. Los resultados son interesantes, ya que la inteligencia artificial buscará patrones de proximidad en colores para crear formas cercanas al objeto que le pidieron identificar. Así, de una imagen con puntos aleatorios de color, empiezan a surgir extrañas coincidencias (como las que pueden ver aquí abajo cuando le pidieron identificar “plátanos” o “manijas de puerta”).

“Entrenamos a la red mostrándole ejemplos de lo que queremos que aprenda, esperando que extraiga la esencia de la cuestión (por ejemplo, un tenedor tiene una manija y de 2 a cuatro “dientes”) y que ignore lo que no importa (un tenedor no puede tener cualquier forma, color u orientación).”

De ahí, los investigadores le pidieron a la inteligencia artificial que interpretara imágenes dadas (pinturas o paisajes) para resaltar ciertos patrones abstractos, como líneas o formas que se repiten sin que necesariamente, por nuestro propia cultura de la imagen, les prestemos particular atención.

Google-IA-11
Pinturas interpretadas con formas y patrones

Una vez que la computadora es capaz de generar estas imágenes, los investigadores buscaron dar un paso más y le pidieron a la máquina que encontrara, según su base de datos, todas las relaciones posibles que pudiera interpretar en cualquier imagen. Y aquí entra la ciencia ficción dura. Porque por este proceso que llaman inceptionism, Google logró que la inteligencia artificial creara sus propias relaciones aleatorias con objetos conocidos en una foto de árboles, edificios, fachadas, paisajes o, más poéticamente, en las nubes que veíamos de niños para encontrar formas conocidas.

Y el resultado es algo tan hermoso como francamente perturbador. Al crear relaciones aleatorias según los objetos que conoce, la máquina comenzó a crear formas fantasmáticas por relaciones aleatorias. De pronto, de la pintura de un caballero surgen perros-ardilla o figuras humanoides de múltiples ojos y colas peludas, de una nube nacieron los llamados “perro-almirante”, el “cerdo-caracol”, un “pájaro-camello” y el “perro-pescado”. Claro, estas coincidencias específicas que causan tanta sorpresa se dieron cuando, en vez de pedirle a la máquina que restringiera su búsqueda a formas o patrones abstractos, le pidieron que buscara formas animales.

Google-IA-04
Interpretación de nubes a detalle, el perro-almirante, el cerdo-caracol, el pájaro-camello y el perro-pescado

Y hay otros ejemplos interesantes, como cuando le pidieron que reconociera estructuras arquitectónicas en formas vegetales. Ahí la máquina creó, como podemos ver aquí abajo, pagodas de pinos, caseríos fantasmagóricos o paisajes bizarros a partir de imágenes aleatorias de pixeles dispersos.

“Claro, podemos hacer mucho más que ver nubes con estas técnicas. Podemos aplicarlas a cualquier imagen. Los resultados varían según el tipo de imagen, porque los parámetros con que se alimenta la red tienden hacia cierta interpretación. Por ejemplo, las líneas horizontales tienden a ser interpretadas como torres o pagodas. Las rocas y los árboles como edificios. Pájaros e insectos comienzan a aparecer en fotos de hojas.”

Esta investigación, que por ahora da estas imágenes maravillosas, tiene implicaciones importantes para comprender la forma en que asociamos con la vista líneas y patrones para generar sentido. Y este es, en verdad, el mecanismo terrorífico e intrigante que perseguían los surrealistas en la asociación libre que se da rienda suelta cuando soñamos… o cuando imaginamos despiertos. Todos hemos mirado a las nubes para encontrar formas, o nos hemos quedado horas viendo al fuego e interpretando, en las brasas, caras y gestos, animales y monstruos imposibles. Todos los sueños más alocados de criaturas en la fantasía y la ciencia ficción o en las más viejas mitologías, nacen de acercamientos que creamos entre los objetos que nos rodean y los animales con los que convivimos: la Gorgona, el Minotauro, los Ents de Tolkien o los delirios de vieja tradición lovecraftiana son, justamente, aleaciones interpretadas por nuestra imaginación a partir de la realidad que nos rodea.

Google-IA-05
Interpretación de pixeles aleatorios como fachadas arquitectónicas elaboradas

Y claro, aquí llegamos hasta los límites de nuestra imaginación especulativa en los escritos, por ejemplo, de Stanislav Lem. En la ciencia ficción del enorme escritor polaco, encontramos insistentemente una pregunta que nos destantea: ¿qué tal que no podemos imaginar la vida en otros planetas porque no podemos entender la forma que tendría (Solaris)? ¿Qué tal que los extraterrestres no son humanoides sino figuras completamente ajenas a lo que nuestra imaginación puede crear según patrones conocidos? ¿Cómo podemos representarnos seres de otras dimensiones si no podemos conceptualizar una vida fuera de las formas que nos da la dimensión que habitamos (“Non Serviam” y “La Nueva Cosmogonía” en Vacío Perfecto)?

Todo esto deja bastantes implicaciones, como vimos, para reflexionar en la forma en que los humanos imaginan y relacionan semánticamente los patrones y las formas que observan en su cotidiano.

“Estas técnicas nos ayudan a entender y visualizar cómo las redes neuronales son capaces de llevar a cabo complejas tareas de clasificación, cómo se puede mejorar la arquitectura de estas redes y observar cómo aprenden durante el entrenamiento. También nos hace preguntarnos si las redes neuronales no podrían ser una herramienta valiosa para artistas –una nueva forma de ‘remixear’ conceptos visuales– o quizás, incluso, hacernos comprender mejor la raíz de todo proceso creativo.”

Así, nos adentramos cada vez más en comprender la forma en que creamos y estructuramos nuestro mundo mientras nos sorprendemos de encontrar otras formas de verlo, otras formas de estructurarlo, a través de los ojos de una máquina. Desde una inteligencia artificial recién nacida, estas imágenes nos permiten ver, con sorpresa encantadora, que nuestro mundo puede observarse de otra forma, crear siempre otras asociaciones.

Google-IA-02
Interpretación de árboles como pagodas y ojas como pájaros

Si quieren deleitarse más en este delirio increíble, aquí hay una galería más completa.

vía Quartz

fuente Google Research Blog

temas