MidJourney – pour tout comprendre (le dossier complet)

Robot pianotant sur son PC
Quand un robot conçoit une image, et qu'en plus elle est belle...

Sommaire :

MidJourney ?… Discord ?… Pourquoi deux plateformes ?
Comment démarrer l'expérience MidJourney ?
C'est quoi "prompt" ? Le bruit de quelqu'un qui éternue ?…
Attention, vous n'avez droit qu'à 25 essais, ensuite ça devient payant !
Comment lancer une requête avancée…
La partie "image
La partie "description"
Trucs pour le cadrage
La partie "paramètres"
Le bouton d'actualisation
Un gros morceau : Le paramètre seed
Obtenir une image qui soit dans le même style qu'une image ne provenant pas nécessairement de MidJourney
Quelques autres paramètre utiles
Houlà, il y a bien du monde dans ces salons
Liens utiles

Voici un dossier expliquant comment utiliser MidJourney, l’intelligence artificielle qui permet de générer des images.

La première chose qui frappe le débutant, c'est l'existence de deux plateformes (qui sont en fait complémentaires) : MidJourney et Discord.

MidJourney ?... Discord ?... Pourquoi deux plateformes ?

Logo Midjourney

MidJourney est un laboratoire d'intelligence artificielle de création d'images, qui, contrairement à nombre de ses concurrents, ne se contente pas de viser le réalisme, mais également (surtout, en fait) la beauté artistique. Le résultat est tout simplement bluffant. Pour en arriver à de telles performances, ce logiciel a été entraîné à analyser des quantités astronomiques d'images accompagnées d'une description écrite. Comme nous le savons tous, internet en héberge énormément, y'a qu'à se baisser…

Logo_ Discord

Discord, quant à lui, était à l'origine une messagerie multimédia en ligne. Créée en 2015, elle permet à des personnes ayant des intérêts communs de partager et de communiquer entre eux, que ce soit par textes, voix, ou même… images. Discord est particulièrement populaire parmi la communauté des gamers (joueurs de jeux vidéo) car il leur offre un moyen de communiquer et de développer une communauté en dehors des jeux en eux-mêmes.

À force de grandir et de se perfectionner, il est aujourd'hui assimilé à un réseau social à part entière avec plus de 140 millions d'utilisateurs actifs, bien au-delà de son cercle originel de gamers.

Aujourd'hui, les administrateurs de MidJourney ont décidé de rendre la dernière version de leur merveilleux joujou accessible au public. Pour cela ils ont pris le parti d'utiliser les canaux de communication de Discord, qui s'y prêtent idéalement. Ainsi, nous pouvons tous accéder au lab de MidJourney, et c'est sur Discord que ça se passe.

Comment démarrer l'expérience MidJourney ?

Avant toute chose, sachez que l'application Discord se charge aisément sur Smartphone et PC. Mais vous pouvez aussi utiliser directement la version en ligne depuis votre navigateur internet.

Pour commencer, vous avez besoin d'un compte Discord. Si vous n’en avez pas, vous pouvez en créer un nouveau en vous rendant sur discord.com.

Ensuite, rendez-vous sur le portail midjourney.com, et cliquez sur la mention “Join The Beta”.

Vous recevrez alors dans votre boîte mail une invitation pour rejoindre le serveur Discord de MidJourney, auquel vous pourrez accéder depuis l’application Discord. Ouf ! Un peu laborieux, me direz-vous peut-être ? Soyez rassurés, le plus dur est passé !

Si vous avez peur de vous mélanger les pinceaux, n'hésitez pas vous laisser guider par ce tuto ultra rapide (en fait j'ai moi-même débuté ainsi!).

Ensuite, il suffit de cliquer (dans Discord) sur un salon dont le nom commence par le préfixe #newbie.

C'est quoi "prompt" ? Le bruit de quelqu'un qui éternue ?...

Pas du tout ! Il s'agit tout simplement d'un synonyme de "requête", pris au sens large. Un prompt, c’est l’instruction que vous donnez à l’IA pour lui indiquer quelle image vous voulez obtenir.

En vous rendant dans le salon, il vous suffira de saisir vos prompts (...si vous le voulez bien, nous parlerons plutôt ici de requêtes) à l'endroit adéquat (tout en bas de l'écran), en tapant exactement /imagine . Cela fera apparaître la mention "Prompt". Ensuite de formuler votre demande à l'intérieur de la fameuse "zone de prompt" ainsi révélée, comme vous le montre l'exemple ci-dessous.

Illustration pour un schéma explicatif

N'hésitez pas à concevoir votre requête comme vous le feriez pour une recherche Google, en définissant le plus clairement possible le sujet, le style que vous recherchez, et en y ajoutant d'autres directives comme l’angle de vue, le cadrage, la lumière ou les couleurs que vous désirez (nous y reviendrons plus loin).

Attention, vous n'avez droit qu'à 25 essais, ensuite ça devient payant !

Oncle Picsou n'est pas bien loin...

C'est à ce stade qu'il convient de se montrer vigilant, car la version gratuite de MidJourney ne permet que 25 requêtes. Et il y a fort à parier qu'une fois ce seuil atteint, vous soyez devenus accros ! À ce stade, si vous voulez continuer à profiter de ce petit monde enchanteur, il vous faudra débourser 10$ HT par mois pour avoir droit à 200 requêtes, ou 30$ HT par mois pour une utilisation illimitée. Quelques petits malins se contentent de créer un nouveau compte Discord, en utilisant bien sûr une autre adresse mail, mais bon, c'est à vous de voir…

Faut-il écrire en français ou en anglais ?

Pour des résultats plus précis il est préférable d'écrire en Anglais (quitte à utiliser des services tels Google Traduction ou Deepl), mais pour des requêtes simples, le français fonctionne très bien.

Attention toutefois aux erreurs dues à des contresens. Un exemple authentique : Je voulais qu'un personnage apparaisse plutôt bien portant, et dans ce but j'avais écrit le mot "enveloppé" dans ma requête. À ma grande surprise, chacun des quatre personnages générés était non seulement très mince, mais en plus il tenait… une enveloppe à la main !

Pour limiter au maximum ce type d'erreurs, j'ai pris l'habitude d'utiliser les services de traduction automatique dans les deux sens (je fais d'abord traduire ma phrase originale en anglais, puis je colle le résultat dans un autre onglet de mon navigateur pour le traduire dans le sens "anglais vers français". C'est beaucoup plus sûr…

Enfin, lorsque je suis sûr de mon coup, c'est en général la phrase anglophone que j'envoie dans ma requête, histoire de limiter les imprévus.

Mais revenons à notre exemple…

Quelques secondes après votre requête, vous recevez une notification vous informant que votre image est prête !

Illustration pour un schéma explicatif
votre premier rendu MidJourney

MidJourney vous propose toujours 4 images de petite dimension pour commencer. À partir de là vous pouvez choisir entre trois actions :

  • Si aucune image ne vous plaît, vous pouvez cliquer sur le symbole Bouton Actualiser (pour MidJourney) pour relancer une génération d’images.
  • Si une image vous plaît, mais que vous ne la trouvez pas parfaite, vous pouvez appuyer sur un des quatre boutons “V” (comme "variation") pour générer une nouvelle "déclinaison" de l'image précédente. Fiez-vous aux grands numéros mauves qui figurent sur l'image ci-dessus pour comprendre comment ces variations sont disposées à l'écran.
  • Enfin, quand une image vous donne entière satisfaction, vous pouvez cliquer sur un des quatre “U” pour lancer un “UPSCALE” (qu'on peut traduire par "afficher à grande échelle"). MidJourney se mettra alors à retravailler l’image désignée pour l'afficher avec une meilleure définition. Vous pouvez désormais la sauvegarder, ou demander à nouveau des variations pour que l’IA procède à un nouveau rendu.

Comment lancer une requête avancée…

Illustration pour un schéma explicatif
Les trois zones d'une requête MidJourney

Il faut savoir qu'un prompt (une requête) peut comporter trois parties bien distinctes :

  • Une partie "image" (facultative) ;
  • Une partie "description" (obligatoire) ;
  • Une partie "paramètres" (facultative).

Pour des raisons de clarté, il est préférable que les trois "zones" (lorsqu'elles existent) apparaissent dans l'ordre indiqué sur illustration ci-dessus (image – description – paramètres). Toutefois, ceci n'est pas obligatoire, notamment pour les cas complexes (comme nous le verrons plus loin).

Les requêtes doivent avoir au moins deux images et rien d'autre, ou encore une image et une description, ou encore une description seule pour que tout puisse fonctionner. Les requêtes consistant en une image seule (sans description) sont rejetées.

La partie "images"

La partie "image" (lorsqu'elle existe) se place en général au tout début d'une requête.

Elle est destinée aux requêtes comportant des images déjà existantes. Vous pouvez en effet utiliser des images existantes pour infléchir la composition, le style et les couleurs d'une image à créer. Les requêtes à base d'images peuvent être utilisées seules. Bien entendu, elles peuvent aussi être complétées par des éléments de texte dans la partie "description". Vous pouvez essayer de combiner des images avec différents styles descriptifs, vous obtiendrez ainsi les résultats les plus inattendus.

Une URL d'image doit consister en un lien direct vers une image en ligne (et non vers la page qui contient cette image). Pour ajouter des images à une requête, saisissez ou collez l'adresse web où l'image est stockée. L'adresse doit se terminer par une extension telle que png, gif ou jpg.  

Pour utiliser une image personnelle (qui se trouve en local sur notre disque ou notre smartphone)

Illustration pour un schéma explicatif

Pour utiliser une image personnelle dans le cadre d'une requête, il vous faudra d'abord l'image sur Discord. Pour télécharger une image, cliquez sur le signe + près de la zone de saisie. Sélectionnez ensuite "Uploader un fichier", sélectionnez votre image, tapez un texte quelconque dans la zone d'invite (faute de quoi votre image risque de disparaître), un peu comme pour envoyer un message avec des pièces jointes (c'est d'ailleurs conçu pour cela.

Maintenant, pour ajouter votre image à la requête, commencez à taper /imagine comme d'habitude. Une fois la boîte de requête affichée, faites glisser le fichier image dans la boîte pour ajouter l'URL de l'image. Vous pouvez également cliquer avec le bouton droit sur l'image, sélectionner Copier le lien, puis coller le lien dans la zone de requête.
Si cela ne fonctionnait pas, vous recevrez un message de type "lien non valide". En pareil cas, vous pouvez toujours essayer d'uploader une nouvelle version de votre image, en veillant juste à lui donner un nom plus court (quelques lettres ou chiffres, sans espace ni caractère spécial susceptible de rendre la requête ambiguë).

La partie "description"

C'est la partie la plus importante, celle par laquelle tout le monde a commencé. Dans de très nombreux cas, elle peut très bien suffire. Encore une fois, il s'agit de décrire votre projet d'image de la manière la plus simple possible. Un conseil : n'hésitez pas à vous inspirer des descriptions utilisées dans MidJourney par les utilisateurs, spécialement quand une image retient votre attention ou votre intérêt !

Trucs pour le cadrage

Lors de votre description, si vous voulez exprimer vos intentions sur le cadrage à utiliser lors de la mise au point de l'image, sachez que vous pouvez spécifier des directives telles que :

Cadrage serré,
Cadrage à hauteur d’homme,
Cadrage en contre-plongée,
Cadrage en plongée,
Cadrage large,
Cadrage panoramique,
Cadrage en portrait,
Cadrage en paysage,
Cadrage diagonal,
Cadrage en mosaïque.

La partie "paramètres"

Nous sommes ici dans la dernière zone de cette requête. Rappelons qu'elle est facultative. Pour spécifier un paramètre, vous devez taper deux fois sur le signe moins, suivi du paramètre en question, comme nous allons le voir.

Voici sous ces lignes quelques-uns des paramètres les plus utiles (de notre point de vue) :

--h / --w

Vous pouvez ajouter les paramètres --h et --w à la fin de votre requête pour ajuster respectivement la hauteur et la largeur (exprimées en pixels) des images produites. Ils fonctionnent par multiples de 64, soit :

64, 128, 192, 256, 320, 384, 448, 512, 576, 640, 704, 768, 832, 896, 960, 1024

Notez que ces paramètres ont une valeur maximale de 1024. Sachez toutefois qu'il est conseillé par MidJourney d'utiliser à la place le paramètre --ar. Littéralement "aspect ratio", ce paramètre renvoie aux proportions de l'image, et peut être suivi de valeurs telles que "16:9", par exemple, pour obtenir une image destinée à être affichée plein pot sur un écran 16/9e. (la proportion par défaut étant le carré, soit "1:1").

Un gros morceau : Le paramètre --seed

Comprendre le paramètre

Ce terme peut être traduit de différentes manières, mais pour ma part j'ai choisi d'appeler cela le "bruit". J'ai d'ailleurs déjà évoqué ce phénomène pour vous dans un clip vidéo intitulé "La communication interpersonnelle - Le dialogue"...

IA musicale
Le seed, c'est avant tout du bruit...

S'agissant de traitements informatiques, la notion de "bruit" désigne le plus souvent des données indésirables ou des erreurs dans les données d'entrée ou de sortie lors d'un traitement. Dans une image, le bruit peut être représenté par des pixels indésirables ou des artefacts qui ne sont pas liés à l'image réelle.

Cependant, dans un contexte de créativité appliquée à l'intelligence artificielle, le bruit peut également être considéré comme une source d'inspiration, et même de créativité. En introduisant intentionnellement du bruit ou des perturbations dans les données d'entrée d'un algorithme, cela peut aider à générer des résultats inattendus et créatifs. C'est par ce procédé que les chercheurs ont permis d'explorer de nouvelles perspectives créatives.

Il faut savoir qu'il y a toujours une injection aléatoire de bruit dans le processus de calcul de chaque image MidJourney, et c'est pourquoi lorsque vous générez une image vous obtenez toujours quatre variations qui sont très créatives, assez différentes les unes des autres, avec différents styles, différents degrés de détail et différentes compositions. C'est ainsi que lorsque vous ne précisez pas de paramètre seed, MidJourney le fait en quelque sorte "à votre place", de manière aléatoire, pour chaque image générée.

Comment utiliser le paramètre

L'utilisation de la fonction --seed est un moyen de contrôler la cohérence de vos images par rapport à d'autres images déjà produites. Lorsque vous exécutez une requête qui se termine par "--seed, cela précise le "numéro d'identification" du bruit (...du seed) utilisé pour créer cette image.

Si par la suite vous lancez une nouvelle requête et tapez le même numéro de "--seed", MidJourney utilisera un traitement du même type que celui utilisé pour créer votre image d'origine, rendant ainsi la nouvelle image relativement "comparable" (ou compatible) à la précédente. Cet effet de cohérence est souvent recherché par les graphistes ou les directeurs artistiques pour leurs propres productions.

Par exemple, à titre expérimental, vous pourriez choisir de taper un nombre aléatoire, comme ceci :

/imagine un chapeau d'ours en peluche --seed 1234

Cela aurait pour effet de marquer cette sortie comme étant bien spécifique au niveau traitement. Vous pouvez ensuite rappeler à tout moment un traitement analogue en tapant à nouveau "--seed" suivi du même numéro dans une prochaine requête. Notez que les valeurs employées doivent correspondre à un nombre entier compris entre 0 et 4294967295.

Attention, le paramètre --sameseed dont il est parfois question dans certains forums, fonctionnait à peu près de la même manière, sauf qu'il appliquait le même traitement aux 4 images générées dans la grille. Mais il n'existait que dans les versions antérieures de MidJourney, et a été supprimé dans la version actuelle (la 4). Sameseed est donc assimilable à ce que les linguistes appellent un "faux ami" 🙂

Obtenir une image qui soit dans le même style qu'une image ne provenant pas nécessairement de MidJourney

Il arrive que nous souhaitions obtenir une image dont nous ne connaissons pas la valeur de seed.

Si c'est nous qui l'avons générée, il faut pour cela obtenir du bot de MidJourney qu'il nous communique un numéro de seed de notre image. Encore faut-il que nous puissions la "montrer" à MidJourney (reportez-vous si nécessaire ci-avant, à la section "Pour utiliser une image personnelle").

Assurez-vous tout d'abord que vous avez bien activé l'option "messages privés" sur votre serveur Discord.

Illustration pour un schéma explicatif

Ensuite, il vous suffit d'ajouter l'émoticône (ou l'émoji, si vous préférez) en forme d'enveloppe à votre système de messagerie Discord (choisissez l'enveloppe la plus simple, comme celle qui est reproduite ci-contre )… Puis vous vous positionnez simplement sur le rendu de l'image qui vous intéresse, et vous cliquez sur votre petite enveloppe. Le bot de MidJourney vous enverra aussitôt un message direct comportant toutes les données de votre image.

Illustration pour un schéma explicatif

Remarque : vous pouvez agir de façon similaire pour supprimer des rendus que vous jugez inutiles ou encombrants, en utilisant l'émoji en forme de croix.

Quelques autres paramètres utiles

Le paramètre --no est utile si vous souhaitez exclure un élément de votre image. C'est ce qu'on appelle l'instruction par la négative. Signalons que vous pouvez également utiliser des commandes similaires dans la recherche Google.

Par exemple, si vous spécifiez"--no grenouille" à la fin d'une requête comme "/imagine un étang merveilleux" cela aura pour effet de réduire ou d'éliminer toute image d'une grenouille apparaissant dans le résultat généré. Cependant il est à noter que cela ne fonctionne pas forcément tout le temps…

--stylize ou --s

L'utilisation de la fonction --stylize dans MidJourney change essentiellement le degré artistique des images générées. Vous pouvez également les définir pour qu'ils soient automatiques dans les paramètres (voir la fonction "/settings"), où vous trouverez "Style bas" et d'autres options. À noter : vous pouvez utiliser une version abrégée de la commande qui est --s.

Les nombres doivent être compris entre 0 et 1000. L'utilisation du nombre complet de 1000 peut donner des images follement cool (mais probablement assez éloignées de votre texte de requête). Essayez-le !

--quality ou --q

Ce paramètre détermine le temps de calcul consacré à la création de votre image. Vous pouvez utiliser les valeurs 0,25, 0,5, 1, 2 et 5 pour définir ce paramètre, sachant que la valeur par défaut est 1.

Ainsi, si par exemple vous avez utilisé --q 0,25, votre image sera plus rudimentaire mais 4 fois plus rapide à produire et moins gourmande en termes de temps de calcul.

--chaos

Ce paramètre, suivi d'une valeur comprise entre 0 et 100, modifie le degré de "folie" de la sortie. Les valeurs inférieures donnent un résultat plus conventionnel, tandis qu'avec des valeurs de plus en plus proches de 100 il faut vous attendre à des résultats de plus en plus inhabituels, inattendus, voire "déjantés" par rapport à votre description.

Le bouton d'actualisation

Lorsque vous cliquez sur le bouton d'actualisation Bouton Actualiser (pour MidJourney) , la même requête sera à nouveau exécutée. Quand MidJourney fait cela, vous pouvez vous attendre à des résultats différents, bien sûr. Parfois, ils peuvent être plus ou moins liés à la précédente sortie d'image, mais pas forcément, car ils ont injecté une dose d'aléatoire, comme nous avons pu le voir ci-avant.

En fait, on peut très bien saisir les zones dans l'ordre qu'on veut...

Il existe des cas où il est malaisé de construire notre requête sur le mode "Toutes les images… puis la description… et enfin les paramètres". Si vous êtes sûrs de ce que vous faites, n'hésitez pas à mêler images, description et paramètres comme bon vous semble pour construire des requêtes plus personnalisées, du type "Un personnage dont le visage correspond à [image1] dans le décor de [image2]" (bien entendu, en pareil cas vous remplacerez [image1] et [image1] par les url correspondantes).

Dernières recommandations

Houlà, il y a bien du monde dans ces salons…/a>

Les salons du type #newbie sont bien encombrés, c'est le moins que l'on puisse dire. Ainsi, entre le moment où votre requête est lancée et le moment où le résultat arrive, des tonnes d'autres images peuvent venir s'interposer dans le fil de discussion. Ce qui, convenons-en, n'est pas très pratique.

C'est ce que je me suis dit au début, et j'imagine que certains d'entre vous se diront la même chose. Pour ma part, j'ai résolu le problème en créant tout simplement mon propre serveur sur Discord. Voici la procédure que j'ai utilisée :

  • Bouton"+" à gauche (dans le rond noir)
  • "Ajouter un serveur"…
  • "Créer le mien".

J'ai découvert qu'une fois le serveur créé, on pouvait très bien y inviter le bot de MidJourney, lequel a d'ailleurs très gentiment accepté ! 🙂

Voilà qui est tout de même beaucoup plus reposant et bien plus pratique. Je vous suggère d'en faire autant, la procédure n'est pas très compliquée, vous verrez.

Demander l'aide de ChatGPT pour construire un prompt ?

Il m'arrive parfois, dans des cas un peu tordus, de m'adresser à ChatGPT pour lui poser une colle dans le style "Je cherche à construire u prompt pour MidJourney dans le but de faire ceci ou cela...". Parfois on tombe sur un bide, mais dans de nombreux cas cela fonctionne impeccablement, en me retirant ainsi une sacrée épine du pied, alors pourquoi ne pas essayer ?

Liens utiles

https://www.youtube.com/watch?v=BsptbUjfIXc

Il s'agit d'un tuto basique de mise en route (sur YouTube)

https://www.google.com/search?q=liste+de+prompts+pour+midjourney

Si vous demandez à Google de vous aider à trouver des idées de prompts pour MidJourney, vous récolterez une moisson d'infos utiles...

https://korben.info/search/midjourney

Le site du geek génialissime (et souvent drolatique) Korben. Il regorge de trucs et astuces pour utiliser MidJourney… Je vous le recommande très chaleureusement.

https://replicate.com/methexis-inc/img2prompt

Ce lien vous permettra de générer une requête d'après une image que vous avez-vous-même uploadée. Il est précieux, car de nombreux autres services de ce type sont payants, alors qu'à l'heure où nous écrivons ces lignes, celui-ci est gratuit !

En fait, si vous disposez déjà d'une image et que vous "séchez" pour imaginer sa description, replicate.com vous permettra de découvrir en quels termes un robot analyse votre propre image… Ainsi, il y a de fortes chances pour que cela "fonctionne dans l'autre sens" le jour où vous aurez envie de générer une image A qui soit dans le même style qu'une image B.

A bon entendeur...


Dans la même série : Comment modifier les couleurs de Chrome ?



– Commentaires Facebook –

Le Petit Abécédaire...

Livre 'Petit abécédaire...' - Bernard Lamailloux

"Un ouvrage bien documenté, écrit par quelqu'un qui sait de quoi il parle et qui le fait avec clarté humour et éthique. Les exemples et les conseils sont judicieux et très utiles. Je le recommanderai avec plaisir.."

Josiane de Saint Paul

Quel livre ! Un travail de moine. D'une grande originalité. J'ai à peine commencé à le parcourir et, déjà, je le savoure. Je vais d'ailleurs continuer à le déguster lentement. Bravo !

Serge Marquis


– Commentaires Facebook –

6 réponses sur “MidJourney – pour tout comprendre (le dossier complet)”

  1. Salut Bernard
    Vous pouvez pas expliquer comment créer son propre Newbie ou si vous avez des infos là dessus, c’est vraiment cela qui m’intéresse, je suis abonné à MJ et je trouve pas grand chose là dessus.

    Un Grand merci

    1. Bonjour Edgar

      Voici la procédure que j’ai utilisée dans Discord pour créer mon serveur :
      • Bouton »+ » à gauche (dans le rond noir)
      • « Ajouter un serveur »…
      • « Créer le mien ».

      Je vais d’ailleurs m’empresser d’ajouter ces infos à mon article, car j’imagine que ça servira à d’autres.

      Merci de votre collaboration, s’il y a autre chose, n’hésitez pas !

    1. Merci Jean Pierre. En fait c’est en faisant mes propres recherches (dans le but de faire connaissance avec ce MidJourney dont tout le monde parle) que je me suis aperçu que la documentation disponible sur ce sujet était plutôt rare, le plus souvent en anglais, et en tout cas très éparse. Après mon « parcours du combattant », donc, je me suis mis en tête d’écrire l’article que j’aurais bien aimé trouver moi-même en arrivant. Si cela a pu servir à d’autres, mon objectif est pleinement atteint. Merci de votre appréciation et bonne journée à vous 🙂 !

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *