¿Puede la Inteligencia Artificial ganar un concurso de postales navideñas?

Muchas empresas y organizaciones convocan concursos de postales navideñas entre los hijos de sus empleados, y GMV no es una excepción. Sin embargo este año el departamento de Inteligencia Artificial y Big Data (BDA) de GMV hizo un pequeño experimento: participar en el concurso con una felicitación generada por un sistema de Inteligencia Artificial sin, por supuesto, conocimiento del jurado. ¿Seríamos capaces de engañar al jurado, haciéndola pasar por una tarjeta creada por un niño? ¿Ganaría el concurso? ¿Qué lecciones podríamos sacar de todo ello?

Creando y entrenando a GrinchGAN

GrinchGAN es el sistema desarrollado por GMV para dar respuesta al reto anterior. Se basa en las GAN (Generative Adversarial Networks o Redes Generativas Antagónicas en Castellano), cuya idea fundamental consiste en poner dos redes neuronales a competir entre sí. Por un lado, una red G, llamada generadora, produce imágenes a partir de ruido, que transmite a otra red D, llamada discriminadora, que trata de distinguir si la imagen que recibe es real o generada por G.

Mediante la repetición de este proceso, las dos redes aprenden una de la otra, obteniendo de este modo, un generador capaz de crear muestras totalmente nuevas de apariencia realista, sin copiar ni mezclar las imágenes de entrenamiento originales. Por otro lado, el discriminador aprende a distinguir cada vez mejor las imágenes reales de las generadas, forzando al generador a mejorar sus resultados. Esta idea se muestra esquematizada en la Ilustración 1.

Generative Adversarial Networks

Ilustración 1. Generative Adversarial Networks [1]

Para desarrollar el experimento, se han obtenido imágenes de entrenamiento de Google Images, siendo suficiente una muestra de unos 800 árboles (algunos ejemplos se pueden ver en la parte superior izquierda de la Ilustración 3). Una vez entrenada la GAN, conseguimos obtener imágenes de resolución razonable y suficientemente parecidas a árboles. Con las imágenes obtenidas, hicimos una selección manual de las que parecían más prometedoras (parte superior derecha de la Ilustración 3) y, de ellas, seleccionamos la que nos parecía que podría obtener mejores resultados. Con esta imagen, dado que uno de los requisitos es que la felicitación incorpore el logo de GMV, optamos por escribirlo a mano con Paint.

El paso final, al que debemos que el resultado sea de tan alta calidad y con apariencia de dibujo, es la utilización del Neural Style Transfer (Transferencia Neuronal de Estilo en Castellano). Esta técnica tiene como objetivo extraer el estilo y el contexto de dos imágenes, origen y destino, para trasladar el estilo de la imagen de origen a la de destino, manteniendo el contexto de ésta. En la Ilustración 2 se muestra un esquema del funcionamiento de la técnica. En nuestro caso, hemos elegido como origen una imagen de una edición anterior del concurso (parte baja central de la Ilustración 3) y nuestro árbol como destino. Separamos así el estilo del origen (colores, texturas) del contexto (manos) y reemplazamos el estilo en el destino, manteniendo el contexto (árbol, logo). De este modo, obtenemos la felicitación de la parte central izquierda de la Ilustración 3).

 

Transferencia Neuronal de Estilo

Ilustración 2. Neural Style Transfer [2].

Arquitectura de GrinchGAN.

Ilustración 3. Arquitectura de GrinchGAN.

Y el ganador es …

El resultado del experimento ha sido sumamente interesante, ya que ninguno de los jueces sospechó que la imagen fuera ficticia, con lo que podríamos afirmar que nuestra imagen generada puede competir en igualdad de condiciones con dibujos hechos por niños y, además, que es indistinguible para un humano.

Postal navideña

Ilustración 4. Felicitación presentada al concurso.

No obstante, aún quedan algunas cuestiones a resolver.

  • Por un lado, la resolución, aunque no es mala, es insuficiente para rellenar un folio A4 sin perder calidad.
  • Por otro, uno de los comentarios del jurado fue que les gustaría ver el dibujo original. Esto trae sus propios quebraderos de cabeza, ya que no tenemos la posibilidad de imprimir la imagen con las texturas propias de una imagen dibujada con, por ejemplo, acuarelas, limitando por tanto la credibilidad.

Las buenas noticias son que, pese a que al jurado le gustaba el dibujo, percibía algo “distinto” en ello, que ni el mismo jurado conseguía explicar. O no hilamos suficientemente fino, o el dibujo de un niño todavía puede emocionar más que el de la inteligencia artificial. Pero, pese a las limitaciones expuestas, la imagen quedó en el segundo puesto de su categoría, dejando claro que dentro de muy poco, el Grinch podría robarles el concurso navideño a los niños de GMV con tan sólo un ordenador y paciencia.

Aunque nos hubiera gustado ganar el concurso, la ética personal y profesional nos imponían ciertos límites que no quisimos superar. Si bien es verdad que el jurado desconocía el origen de nuestra tarjeta de felicitación, sí informamos a la persona responsable del concurso para que estuviera al tanto. Lejos de prohibirnos el experimento, nos animó y felicitó por ello. Pero en todo momento estaba pendiente por si hubiera que descalificar la tarjeta (caso de haber sido elegida la ganadora en su categoría).

Esto, que en principio parece un experimento inocente, nos debería hacer reflexionar sobre el futuro a corto y medio plazo de la inteligencia artificial, que es capaz de construir Deep Fakes cada vez más realistas, influenciar al electorado en campañas políticas, e incluso publicar noticias falsas generadas con IA. ¿Hace falta regular la IA? ¿Se puede publicar cualquier modelo al público general? Una discusión muy interesante sobre el tema en el dominio de los modelos de lenguaje (GPT-2) se puede ver en: https://openai.com/blog/better-language-models/.

Seguiremos innovando.

 

Autor: Antón Makarov

[1] https://medium.com/analytics-vidhya/intuitive-explanation-of-gan-93de2dbcce85

[2] https://becominghuman.ai/creating-intricate-art-with-neural-style-transfer-e5fee5f89481

 

Las opiniones vertidas por el autor son enteramente suyas y no siempre representan la opinión de GMV
The author’s views are entirely his own and may not reflect the views of GMV
Share

    Deja un comentario

    Tu dirección de correo electrónico no será publicada. Los campos necesarios están marcados *

      I accept the privacy policy Acepto la Política de Privacidad

    Basic Data-Protection information:

    Data-protection supervisor: GMV Innovating Solutions SL
    Purpose: Answer questions, respond to user complaints and recommendations, receive job applicants resumes and career information.
    Legitimation: Consent of data subject
    Addresses: Grupo GMV companies
    Rights: Access, rectify and cancel data plus other rights, as explained in additional information
    Additional information: You can check out the additional and detailed data-protection information on our website:Privacy Policy

    Puedes usar las siguientes etiquetas y atributos HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

    WP-SpamFree by Pole Position Marketing

    1.599 Total Views