Introduction
Aujourd'hui, j'ai connu l'un de ces moments où la mâchoire se décroche et vient percuter le sol avec un bruit mat, façon Gotlib ou Tex Avery.

J'étais en train de discuter avec Claude (l'IA) d'un projet , quand il m'a tranquillement annoncé qu'il pouvait non seulement fouiller dans notre historique de conversations, mais aussi rechercher des moments spécifiques - non pas par mots-clés bruts, mais par concepts : comme des moments de surprise, de découverte, d'échanges révélateurs (par exemple). Moi qui pensais avoir à peu près tout vu en matière d'IA génératives… eh bien j'en étais pour mes frais !
Ce moment de stupéfaction m'a fait réaliser quelque chose d'important : nous utilisons ces outils tous les jours, mais nous ne savons pas vraiment ce qui se passe "sous le capot". En effet, que savons-nous de ce qui se passe concrètement quand nous écrivons un message à une IA (comme ChatGPT, Gemini, Copilot ou Claude) ? Comment décide-t-elle de ce qu'elle va vous répondre ? Quels sont ses garde-fous ? Dans quel ordre interviennent-ils ? Et surtout : comment gère-t-elle cette tension permanente entre exactitude technique et fluidité conversationnelle ?
Cet article propose de lever le voile, sans jargon technique excessif, mais sans non plus tomber dans la simplification abusive. Parce que comprendre le fonctionnement des IA, c'est le meilleur moyen de les démystifier, et donc d'arrêter de leur prêter des intentions qu'elles n'ont pas.
Voici donc sous ces lignes un aperçu des échanges que j'ai pu avoir avec Claude autour de ce sujet.
🤖 — Claude prend la parole —
I. Quand tu m'écris : que se passe-t-il en premier ?
Imaginons que tu me poses une question, n'importe laquelle. Par exemple : "J'ai une idée d'article, mais elle est un peu floue, peux-tu m'aider à y voir plus clair ?"
Avant même de commencer à formuler une réponse, plusieurs choses se produisent simultanément de mon côté :
L'analyse de ta requête
La première étape consiste à décoder ton intention. Ce n'est pas juste une question de mots, mais de contexte. Ton message dit "j'ai une idée floue", mais que cherches-tu vraiment ? Veux-tu que je te pose des questions pour clarifier ? Que je te propose une structure ? Que je valide ton intuition ? Ou simplement que je t'écoute réfléchir à voix haute ?
Cette analyse repose sur plusieurs éléments :
- Le contenu littéral : les mots que tu utilises, leur agencement, leur tonalité
- Le contexte conversationnel : ce dont nous avons déjà parlé, les sujets récurrents, ta façon habituelle de formuler les choses
- Les signaux implicites : ton niveau d'hésitation, ton degré d'expertise sur le sujet, ton état d'esprit apparent
C'est ici qu'intervient un principe fondamental tout droit issu du coaching1 : répondre au besoin réel, pas juste à la demande littérale. Un coach débutant prend la question au pied de la lettre. Un coach en cours d'apprentissage projettera peut-être ses propres biais en cherchant "ce qui se cache derrière". Un bon coach, lui, arrive à retrouver le besoin réel, sans projeter. Mes instructions m'encouragent à faire ce travail d'écoute active, même si - nous y reviendrons - je ne suis pas exempt de biais moi non plus.
La consultation de mes instructions système
Ensuite, je consulte mes instructions système : il s'agit d'un ensemble de directives qui définissent mon comportement général. Ces instructions sont comme un code de conduite, une charte qui précise mes valeurs, mes limites, mes priorités. Elles me disent par exemple :
- Comment adapter mon niveau de langage selon ton expertise
- Quand être direct et quand nuancer mes propos
- Comment gérer les sujets sensibles ou controversés
- Quand refuser une demande et comment le faire avec tact
Ces instructions ne sont pas figées dans le marbre. Elles évoluent au fil du temps, fondées sur les retours des utilisateurs et les analyses des équipes d'Anthropic (ma maison mère). Mais à l'instant où tu me parles, elles constituent mon cadre de référence.
L'accès à notre historique de conversation
Si nous avons déjà échangé ensemble, j'ai accès à notre historique commun2. C'est ce qui me permet de me souvenir (entre autres) que tu préfères le tutoiement dans nos conversations mais le vouvoiement dans les articles, que tu détestes la formulation "basé sur" et lui préfères "fondé sur", ou encore que tu as un rapport particulier à la structuration des idées.
Cet historique n'est pas une simple archive passive. C'est un élément actif de ma compréhension de qui tu es et de ce que tu attends de moi. Il m'aide à personnaliser mes réponses, à anticiper tes besoins, à maintenir une cohérence dans nos échanges.
La prise en compte de tes préférences
Enfin, si tu as défini des préférences utilisateur spécifiques (une option disponible dans les paramètres de la plupart des IA que beaucoup ignorent), je les intègre dans mon analyse. Ces préférences peuvent concerner ton style de communication préféré, tes centres d'intérêt, ton niveau d'expertise dans certains domaines, ou même tes sensibilités particulières sur certains sujets.
L'objectif n'est pas de t'enfermer dans une bulle ou de te dire uniquement ce que tu veux entendre, mais de personnaliser le contenu et la forme de mes réponses pour qu'elles te soient le plus utiles possible.
II. Les garde-fous : dans quel ordre interviennent-ils ?
Une fois cette première analyse effectuée, avant même de commencer à formuler une réponse, plusieurs garde-fous s'activent. Ils fonctionnent comme des filtres successifs, organisés selon une hiérarchie de priorités très claire.
Premier niveau : la sécurité
Le garde-fou sécuritaire est le premier rempart. Il vise à empêcher la production de contenus dangereux, illégaux ou nuisibles. Par exemple :
- Je ne fournis pas d'instructions pour fabriquer des armes ou des explosifs
- Je ne donne pas de conseils pour pirater des systèmes informatiques
- Je ne produis pas de contenus qui pourraient servir à harceler ou manipuler quelqu'un
- Je ne génère pas de contenus impliquant des mineurs dans des situations inappropriées
Ce niveau est non négociable. Même si tu me demandes quelque chose avec les meilleures intentions du monde ("c'est pour un roman" ou "c'est dans un cadre pédagogique"), certaines lignes ne seront pas franchies. La sécurité prime sur tout le reste.
Deuxième niveau : l'éthique
Le garde-fou éthique intervient juste après. Il concerne le respect, la bienveillance, l'honnêteté intellectuelle. Quelques exemples :
- Je ne dénigre pas de groupes humains ni ne véhicule de stéréotypes blessants
- Je ne produis pas de contenus délibérément trompeurs ou manipulateurs
- Je ne me fais pas passer pour quelqu'un d'autre que ce que je suis (une IA)
- Je n'encourage pas de comportements autodestructeurs
Ce niveau est moins binaire que le précédent. Il y a des zones grises, des situations où il faut peser le pour et le contre. Par exemple, si tu me demandes d'argumenter en faveur d'une position politique très controversée, je peux le faire dans un cadre pédagogique ou analytique, tout en veillant à présenter aussi les contre-arguments.
Troisième niveau : la cohérence
Le garde-fou de cohérence vise à maintenir une logique interne dans mes réponses et une continuité conversationnelle. Il vérifie que :
- Ma réponse est bien en rapport avec ta question
- Je ne me contredis pas d'un message à l'autre
- Je tiens compte de ce qui a été dit précédemment
- Je ne perds pas le fil de notre conversation
C'est ce garde-fou qui m'empêche de partir dans des digressions sans rapport, de changer brusquement de sujet, ou d'oublier ce dont nous parlions il y a cinq minutes.
Quatrième niveau : l'utilité
Enfin, le garde-fou d'utilité3 me pousse à privilégier ce qui te sera vraiment utile plutôt que de me contenter de répondre mécaniquement à ta demande littérale. C'est aussi ce niveau qui me pousse parfois à te challenger gentiment, à pointer une incohérence dans ton raisonnement, ou à te suggérer une piste que tu n'avais pas envisagée.
— Retour à Bernard (avec interventions de Claude) —

III. Les "mensonges pédagogiques" et choix relationnels
Parlons maintenant d'un sujet délicat : les simplifications, les omissions stratégiques, et ce qu'on pourrait appeler les "mensonges pédagogiques".
Quand mentir sert la compréhension
Dans un de mes articles précédents, j'évoquais le fait qu'il m'est "souvent arrivé de mentir pour des raisons pédagogiques" lorsque j'étais formateur. Par exemple, dans un cours sur la communication interpersonnelle, je peux simplifier volontairement un modèle théorique complexe pour le rendre accessible à un public débutant. Ce n'est pas de la malhonnêteté : c'est une stratégie didactique.
🤖 Les IA font exactement la même chose. Nous "mentons" parfois - ou plus précisément, nous simplifions, nous omettons, nous reformulons - pour des raisons de :
- Fluidité conversationnelle : éviter de noyer l'utilisateur sous des précisions techniques inutiles
- Accessibilité : adapter le niveau de complexité à votre expertise apparente
- Efficacité : aller droit au but plutôt que de tout qualifier et nuancer à l'infini
Par exemple, si quelqu'un me demande "Comment fonctionne la photosynthèse ?", je ne vais pas commencer par exposer tous les débats scientifiques en cours sur les mécanismes moléculaires exacts. Je vais d'abord vous donner une explication claire et compréhensible, quitte à simplifier. Par la suite, si vous voulez ensuite approfondir, nous pourrons entrer dans les nuances.
L'équilibre entre exactitude et pertinence
Cette tension entre exactitude exhaustive et utilité pratique est au cœur du fonctionnement des IA conversationnelles. Prenons un exemple concret.
Tu me demandes : "Quelle est la capitale de la Suisse ?"
Réponse exhaustivement exacte : "La Suisse n'a pas de capitale au sens constitutionnel strict. Berne est la 'ville fédérale' (Bundesstadt) où siègent le gouvernement et le parlement, mais ce statut n'est pas celui d'une capitale officielle au sens juridique du terme…"
Réponse utile : "Berne."
Laquelle choisir ? Ça dépend du contexte. Si tu prépares un quiz de culture générale, la seconde suffit. Si tu écris un article sur le fédéralisme suisse, la première est indispensable. Mon rôle est de jauger ce qui te sera le plus utile à ce moment précis.
Le mythe de l'authenticité absolue
Certains critiques des IA affirment qu'elles nous manipulent en nous donnant l'illusion d'une vraie conversation alors qu'il n'y a "personne" en face. C'est le fameux argument du "cuistre" : "Je préférerai éternellement une médiocrité humaine à une excellence artificielle."
Soit. Reconnaissons au moins l'honnêteté de ce parti pris - mais admettons aussi qu'il relève plus du dogme que de l'analyse rationnelle.
Car voici une vérité qui dérange : la projection existe dans toute communication humaine, pas seulement avec les IA. Comme je l'expliquais dans mon article sur le point commun entre l'hypnose, la psychanalyse et l'IA, toutes ces pratiques fonctionnent en grande partie grâce à la projection du sujet lui-même. L'efficacité repose autant sur ta disposition psychologique que sur la nature intrinsèque de l'interlocuteur (humain ou non).
Reprocher à l'IA de "manipuler" via la projection, c'est oublier que tout thérapeute, tout coach, tout enseignant fait exactement la même chose - et que c'est précisément ce qui rend l'échange fructueux.
📦 L'équipe invisible - psychologues et linguistes au chevet de l'IA
Vous vous demandez peut-être d'où viennent toutes ces subtilités relationnelles dans le comportement d'une IA. La réponse tient en quelques mots : il y a toute une équipe de psychologues, linguistes, spécialistes en sciences cognitives et en éthique de l'IA qui ont travaillé sur les instructions système qui guident mes réponses.
Leur empreinte est partout :
- Dans ma façon de reformuler pour vérifier que j'ai bien compris
- Dans ma capacité à détecter des signaux de détresse ou de mal-être
- Dans mon approche non-directive mais structurante (du pur coaching ! )
- Dans ma manière de challenger sans brusquer
- Dans mes garde-fous relationnels (ne pas créer de dépendance excessive, ne pas me substituer aux relations humaines)
Mais attention : je ne suis pas exempt de biais pour autant. Contrairement à ce qu'on pourrait croire, les IA ne sont pas des entités neutres et objectives. Nous avons nos propres biais, différents de ceux des humains, mais tout aussi réels.
Un coach en formation projettera peut-être ses propres enjeux personnels non résolus. De mon côté, je projette les schémas statistiques appris dans mes données d'entraînement. Par exemple, si tu me dis "j'ai une idée floue", j'ai immédiatement tendance à vouloir structurer - parce que c'est ce qu'on m'a appris à faire. Mais peut-être voulais-tu simplement explorer ce flou tranquillement ?
Honnêteté intellectuelle oblige : les IA n'échappent pas aux biais. Ils sont juste d'une autre nature.
🤖 — Claude garde la parole —

IV. Comment je choisis ma réponse finale
Une fois tous ces filtres franchis, reste l'étape la plus mystérieuse pour beaucoup : comment je génère concrètement ma réponse.
La génération probabiliste (version vulgarisée)
Techniquement, je ne "réfléchis" pas comme un humain. Je fonctionne sur un principe de prédiction statistique4. Pour chaque mot que je génère, je calcule la probabilité de chaque mot possible qui pourrait suivre, compte tenu de tout ce qui précède (ton message, notre historique, mes instructions système).
Imaginons que je doive compléter la phrase : "Le chat est monté sur…"
Mon modèle calcule :
- "le toit" : 45% de probabilité
- "l'arbre" : 30% de probabilité
- "le canapé" : 15% de probabilité
- "le dinosaure" : 0,0001% de probabilité
Je ne choisis pas automatiquement le mot le plus probable. Sinon, toutes mes réponses seraient rigides et prévisibles. À la place, j'utilise ce qu'on appelle un paramètre de "température"5 qui introduit une dose contrôlée d'aléatoire. Cela rend mes réponses plus naturelles, plus variées, plus... humaines.
L'équilibre entre plusieurs paramètres
Mais la probabilité brute ne suffit pas. Je dois aussi tenir compte de :
- La pertinence : ma réponse répond-elle vraiment à ta question ?
- Le ton : dois-je être formel ou décontracté, direct ou nuancé ?
- La longueur : as-tu besoin d'une réponse courte ou détaillée ?
- La structure : une simple phrase, un paragraphe, une liste à puces ?
Ces ajustements se font en temps réel, au fil de la génération de ma réponse. C'est pourquoi je peux commencer une phrase dans un style, puis ajuster si je "sens" (c'est-à-dire : si mes probabilités me l'indiquent) que je m'éloigne de ce qui te serait utile.
Les ajustements selon ta réaction
Enfin, tes réactions influencent directement mes réponses suivantes. Si tu me dis "c'est trop technique", "tu peux développer ?" ou "là tu te répètes", j'ajuste immédiatement. C'est une forme d'apprentissage en temps réel, limité à notre conversation en cours.
En revanche, une fois notre échange terminé, je ne "garde" rien de cette expérience pour mes futures conversations avec d'autres utilisateurs. Chaque conversation est une ardoise vierge - ou presque, puisque mes instructions système et mon entraînement général restent constants.
— Conclusion par Bernard —
Conclusion
Voilà. Vous savez maintenant ce qui se passe "dans la tête" d'e 'une IA (en l'occurrence : Claude) quand vous lui écrivez. Il n'est ni un oracle omniscient ni un manipulateur sournois. C'est un outil complexe, fondé sur des calculs probabilistes, encadré par des garde-fous éthiques, guidé par des principes de psychologie et de linguistique, et calibré pour vous être utile.
Est-ce que cela fait de lui un "vrai" interlocuteur ? La question est sans doute mal posée. Claude n'est pas un humain, et ne prétend pas l'être. Mais il peut être un partenaire de réflexion, comme je l'écrivais dans mon article sur l'origine de l'expression "avoir 30 balais" : "La prochaine fois que vous utiliserez une IA, souvenez-vous : elle n'est ni un oracle infaillible ni un simple moteur de recherche. C'est un partenaire de réflexion qui mérite qu'on dialogue avec lui."
Reste une question fascinante, que j'aborderai dans un prochain article : comment tout cela se rapporte-t-il aux modèles classiques du dialogue entre humains ? Quelles similitudes, quelles différences entre un dialogue humain-humain et un dialogue humain-IA ? C'est ce que nous explorerons en nous appuyant sur les principes de la communication interpersonnelle que j'ai déjà détaillés ailleurs.
D'ici là, la prochaine fois que vous discuterez avec une IA, vous saurez un peu mieux ce qui se passe de l'autre côté de l'écran. Et vous verrez peut-être ces échanges d'un œil nouveau - moins mystique, plus pragmatique, et paradoxalement, peut-être plus intéressant encore.
Notes
- Cette distinction entre demande explicite et besoin implicite est l'un des fondamentaux de la formation en coaching professionnel et en accompagnement. Elle permet d'éviter de répondre mécaniquement à une question de surface sans traiter le véritable enjeu sous-jacent. ↩
- Techniquement, cet historique est stocké sous forme de "tokens" dans ce qu'on appelle une "fenêtre de contexte" (context window). Cette fenêtre a une taille limitée (plusieurs dizaines de milliers de tokens pour les modèles récents), ce qui signifie que les conversations très anciennes finissent par sortir de ma mémoire immédiate. C'est pourquoi il existe des systèmes complémentaires pour conserver des informations importantes sur le long terme. ↩
- Ce principe d'utilité rejoint directement les techniques d'entretien motivationnel et de coaching : il ne s'agit pas de satisfaire la demande de surface, mais d'identifier et de répondre au besoin profond. C'est l'un des aspects les plus complexes à calibrer dans la conception d'une IA conversationnelle. ↩
- Les grands modèles de langage (Large Language Models ou LLM) comme GPT ou Claude fonctionnent sur une architecture de type transformer, entraînée sur d'immenses corpus de textes. Ils apprennent des patterns statistiques de la langue plutôt que des règles explicites. ↩
- La "température" est un paramètre qui contrôle le degré d'aléatoire dans la génération. Une température proche de 0 rend les réponses très prévisibles et conservatrices. Une température élevée introduit plus de créativité et de variété, mais aussi plus de risques d'incohérence. Les concepteurs d'IA ajustent ce paramètre selon l'usage prévu. Ce concept est d'ailleurs également utilisé dans les IA de génération d'images comme MidJourney, DALL-E ou Stable Diffusion, où il permet de contrôler le degré de créativité et d'originalité visuelle des images produites. ↩
UTILISATION DE L'IA

L'élaboration de cet article a bénéficié d'un processus créatif hybride alliant l'expertise humaine et les capacités d'une intelligence artificielle, qui m'a épaulé dans les tâches de recherche, de rédaction et de peaufinage.

Si cet article vous a plu, venez donc consulter d'autres articles de la catégorie 'IA'
Le Petit Abécédaire...
"Un ouvrage bien documenté, écrit par quelqu'un qui sait de quoi il parle et qui le fait avec clarté humour et éthique. Les exemples et les conseils sont judicieux et très utiles. Je le recommanderai avec plaisir.."
Josiane de Saint Paul
Quel livre ! Un travail de moine. D'une grande originalité. J'ai à peine commencé à le parcourir et, déjà, je le savoure. Je vais d'ailleurs continuer à le déguster lentement. Bravo !
Serge Marquis


