dessin à main levée

Un jeu pour comprendre l’intelligence artificielle DALL-E

Depuis quelques mois, des intelligences artificielles (IA) telles que DALL-E, capables de générer des images à partir de simples instructions textuelles (instructions) qui indiquent quels sujets ou objets doivent apparaître dans l’image résultante.

Découvrir comment une IA convertit les instructions en images peut aider à obtenir une meilleure génération de ces types d’images

Les résultats sont souvent surprenants et selon la description aboutissent même à des « créations » étonnantes. La base du fonctionnement de ce type d’IA est la manipulation de grandes quantités d’images dont il existe une description de ce qui y apparaît. Dès réception de l’IA la description sous forme de texte naturel il oppose les mots saisis aux images auxquelles correspondent celles qu’il a dans sa base de données, il les oppose et crée une nouvelle image à partir des éléments reconnus.

Lorsqu’il s’agit d’obtenir les meilleurs résultats, il est non seulement nécessaire d’écrire quelques instructions mais aussi de connaître en détail le fonctionnement du processus par lequel l’IA convertit les mots en images. Ou, à proprement parler, savoir comment fonctionne le processus précédent, comment à partir d’images précédentes dont une description est disponible, cela permet à l’IA d’apprendre à les relier les unes aux autres lorsqu’on lui demande de traduire des mots en images.

Jeu DALL-Edle

En tant que jeu mais aussi comme moyen d’apprendre ce processus, il est apparu DALL-Edle, une page web montrant différentes images ajout de quatre options de texte parmi lesquelles vous devez sélectionner celle qui est considérée comme ayant servi de rapide pour créer ces images.

Cinq séries d’images sont proposées avec quatre textes possibles qui correspondraient à la instructions qui les aurait générés, dont un devra être sélectionné. Après avoir marqué l’option correspondante, DALL-Edle signale combien de coups a été prise dans cette singulière épreuve de reconnaissance.

prises dall-edle

DALL-E est l’un des modèles d’imagerie AI les plus populaires et c’est celui que DALL-Edle utilise comme base pour essayer de faire comprendre aux utilisateurs le fonctionnement de leur modèle. Pour montrer la partie ludique, ils ont repris dans la structure du nom du site non seulement celui de DALL-E mais aussi celui du jeu populaire Wordle dans lequel vous devez trouver un mot en 6 tentatives maximum.

La mécanique de ce jeu proposée par DALL-Edle essaie de rendre le joueur capable de comprendre comment fonctionne le processus par lequel l’IA transforme des instructions ou des descriptions en images. Il s’agit en quelque sorte de confronter la créativité humaine à la « créativité » artificielle et de démontrer si l’homme est capable de comprendre la machine et inversement.