Cette IA crée des photos et des montages à partir de vos idées !

La société OpenAI, spécialisée dans l’intelligence artificielle, vient de développer un réseau de neurones capable de générer des images photoréalistes. Une simple phrase de texte suffit pour créer presque tous les montages imaginables.

Vous serez également intéressé


[EN VIDÉO] Interview : comment est née l’intelligence artificielle ?
L’intelligence artificielle vise à imiter le fonctionnement du cerveau humain, ou du moins sa logique lorsqu’il s’agit de prendre des décisions. Jean-Claude Heudin, directeur du laboratoire de recherche de l’IIM (Institut de l’Internet et du Multimédia), explique l’origine de ces recherches.

OpenAI vient de sortir une deuxième version de son intelligence artificielle dédié à la génération d’images. baptisé DALL-E 2 (prononcé comme le peintre Dalí), elle est capable de transformer une simple phrase de texte en une image photoréaliste. La première version se contentait d’un dessin sur fond uni. Cette nouvelle IA réalise des compositions beaucoup plus complexes.

OpenAI est un concurrent direct de DeepMind de Google. Cette société dédiée à l’IA a été fondée, entre autres, par Elon Musk et a reçu des investissements de Microsoft. Son DALL-E 2 ressemble au GauGAN (prononcé comme le peintre Gauguin…) de Nvidia, d’abord capable de transformer un croquis en paysage photoréaliste, puis de faire de même à partir d’un phrase textuelle.

Explication du fonctionnement du DALL-E AI avec de nombreux exemples. (En anglais, activer la traduction automatique des sous-titres.) © OpenAI

L’IA peut également produire des variantes d’une image existante

Cependant, DALL-E 2 est beaucoup plus complexe que la concurrence car il ne se contente pas de paysages. L’IA est capable de créer une image combinant plusieurs éléments communs, tels que  » un ours en peluche fait du skate à Times Square « . Le système est basé sur CLIP, un réseau de neurones d’OpenAI formés sur un grand nombre d’images avec description. Cette IA a été conçue pour analyser une image et en proposer une description, mais effectue ici l’opération inverse. Une deuxième étape décode ensuite le résultat de la première afin de créer une image cohérente.

Ce système en deux étapes permet également d’autres possibilités. L’IA est capable de reprendre une image existante et de remplacer un élément, ou de créer une variante inspirée de l’original en modifiant l’angle, la pose et l’aspect du sujet. Cependant, pour éviter les abus, l’IA ne peut pas générer d’images photoréalistes de visages humains, et la firme a limité sa capacité à produire des images à contenu adulte ou violent.

Intéressé par ce que vous venez de lire ?

Laisser un commentaire