Vous rêvez de créer un personnage de Yéti unique et de le rendre viral sur YouTube ? Créer une vidéo de base avec l’intelligence artificielle est simple. Cependant, produire une série de scènes cohérentes et captivantes avec un personnage récurrent représente un défi bien plus grand.
Ce tutoriel vous dévoile une méthode professionnelle pour passer de clips génériques à de véritables courts-métrages. Nous allons utiliser un Yéti vert comme exemple, en exploitant la puissance du format JSON et de ChatGPT pour diriger l’IA de génération vidéo (comme VEO3) avec une précision inégalée.
L’Échec du Prompt Simpliste : Pourquoi « un yéti vert qui danse » ne suffit pas
Lorsqu’on débute, l’approche la plus courante est de donner un ordre simple à l’IA, par exemple : a green yeti who is dancing in ski.
Le résultat est souvent décevant. On obtient une vidéo techniquement correcte, mais sans âme, sans contexte et sans histoire. Le personnage est générique, ses mouvements sont aléatoires et la scène manque cruellement de quelque chose qui puisse retenir l’attention. C’est un clip, pas le début d’une saga. Pour captiver une audience sur YouTube, il faut de la cohérence et un personnage mémorable.
La Méthode Professionnelle : Le Format JSON pour un Contrôle Total
Pour obtenir un résultat cinématographique, il faut structurer sa demande de manière beaucoup plus détaillée. C’est ici que le format JSON (JavaScript Object Notation) entre en jeu. Il permet de définir précisément chaque composant de votre scène, ne laissant aucune place à l’interprétation hasardeuse de l’IA.
Un bon prompt JSON pour la vidéo inclut des « clés » et des « valeurs » pour chaque élément essentiel :
scene_description: Décrit l’environnement général (ex: « Au sommet d’une montagne enneigée la nuit, sous des aurores boréales »).visual_style: Le style visuel de l’image (ex: « Ultra-réaliste, qualité cinématographique, couleurs vives »).camera_movement: Les mouvements de la caméra (ex: « Travelling lent vers le personnage, suivi d’un gros plan sur son visage »).character: La description détaillée du personnage (ex: « Un yéti vert sympathique portant un survêtement Adidas vintage »).action: Ce que fait le personnage (ex: « Il chante une chanson puis se met à danser la Tecktonik »).dialogue: Les paroles prononcées par le personnage.
Point crucial : L’interface de l’IA vidéo fonctionne de manière optimale en anglais. Il est donc impératif de rédiger toute la structure du JSON et les descriptions en anglais, même si le dialogue final du personnage est en français.
Tuto pas à pas : Créer votre scène de Yéti avec ChatGPT
Voici la méthode exacte pour passer de l’idée à une scène aboutie.
Étape 1 : L’idée de départ
Commencez par votre concept simple : « Je veux une vidéo d’un yéti vert qui danse au ski et dit une phrase marrante. »
Étape 2 : Le prompt magique pour ChatGPT
N’ordonnez pas à ChatGPT de créer la scène. Demandez-lui plutôt de devenir votre assistant réalisateur. Utilisez un prompt comme celui-ci :
Je veux créer une vidéo avec l'IA VEO d'un Yéti vert en train de danser au ski. Je ne veux pas de sous-titres. Mon objectif est de créer un fichier JSON qui contient toutes les informations nécessaires pour la scène. Voici les clés que tu dois utiliser : scene_description, visual_style, camera_movement, character, action, dialogue, sound_effects. Pose-moi toutes les questions nécessaires pour créer la meilleure scène possible et la plus détaillée. Étape 3 : La phase créative (Répondre aux questions)
ChatGPT va alors vous interroger sur chaque aspect de la scène. C’est à ce moment que vous injectez votre créativité. Dans notre exemple, les réponses ont permis de définir des éléments uniques :
- Chanson : Il chante « Quand reverrai-je mon pays merveilleux » (référence au film Les Bronzés font du ski).
- Dialogue : À la fin, il dit la réplique culte « Et ben alors, on n’attend pas Patrick ? ».
- Style : Une danse Tecktonik inattendue.
- Look : Un style ultra-réaliste, avec des couleurs adaptées à une scène de nuit.
Étape 4 : Génération et validation
Une fois que vous avez répondu, ChatGPT vous fournira le code JSON complet en anglais. Copiez ce code et collez-le directement dans votre outil de génération vidéo.
Le Résultat : Le Jour et la Nuit
La différence entre la vidéo issue du prompt simple et celle générée avec le JSON est spectaculaire.
- Sans JSON : Un yéti anonyme avance et tourne sur lui-même. C’est oubliable.
- Avec JSON : On obtient une véritable scène. Un personnage identifiable avec une tenue spécifique, sous des aurores boréales, qui chante une référence culturelle, prononce une phrase culte et exécute une danse surprenante. Ce personnage a une âme et un potentiel viral.
La Clé de la Viralité : Créer un Personnage Récurrent
La première scène est la plus importante, car elle établit votre personnage. Une fois que vous avez généré une vidéo qui vous satisfait :
- Capturez l’image parfaite : Prenez une capture d’écran en haute qualité du visage de votre yéti.
- Utilisez-la comme référence : Cette image devient la base pour toutes vos futures créations. En utilisant la fonction « Image vers Vidéo » de l’IA, vous pouvez charger cette photo de référence.
- Créez de nouvelles scènes : Rédigez de nouveaux prompts JSON pour placer ce même personnage dans d’autres situations (à la plage, en train de cuisiner, etc.). L’IA s’assurera de garder une cohérence visuelle parfaite.
En suivant cette méthode, vous ne créez plus des clips aléatoires. Vous construisez un univers autour d’un personnage reconnaissable, capable de fidéliser une audience sur YouTube et de devenir un véritable phénomène.
Pour aller plus loin, retrouvez le tuto complet :

- Avis Teachizy (2025) : La Meilleure Plateforme LMS Française ? (Test Complet & Nouveautés IA) - novembre 8, 2025
- Injection Prompt CV ⚠️ Technique Black Hat : À vos risques et périls - octobre 20, 2025
- Qui est JEAN-MARIE CORDA ? - octobre 15, 2025