Comparaison entre Z-Image Turbo et Nano Banana Pro

J’ai comparé deux modèles de génération d’images : l’un des meilleurs modèles open source, Z-Image Turbo, et le meilleur modèle closed source du moment, Nano Banana Pro de Google.

L’idée n’est évidemment pas de faire une comparaison “pure” entre les deux modèles, puisque Nano Banana est, de toute façon, bien plus puissant. Cependant, le style des images est différent, et la manière d’obtenir de bons résultats l’est aussi.

L’objectif est donc de voir quand et comment Z-Image est meilleur que Nano Banana, afin de savoir dans quels cas il est préférable d’utiliser le modèle le moins cher.

Je vais vous montrer plusieurs prompts et plusieurs résultats, afin que vous puissiez voir ce qui fonctionne, et avoir des exemples concrets, à la fois de prompts et d’images générées.

On va tester plusieurs styles de prompts et plusieurs styles d’images, afin d’avoir un bon aperçu.

1 — Prompt Webdesign

Pour commencer, on a un prompt basé sur du webdesign.

J’ai obtenu ce prompt à partir d’un site web que j’aimais bien. J’ai simplement demandé à Gemini de me donner la structure du site en incluant des ASCII pour tous les composants. Ensuite, j’ai appliqué une palette de couleurs et ajouté le contenu.

WEBSITE DESIGN SPECIFICATIONS - FINANCIAL TERMINAL UI
RESOLUTION: 736 x 1805

AESTHETIC OVERVIEW
The interface is designed as a high-end, cozy financial terminal for data science professionals. The background uses a deep, soft grey-blue (Base #24273A) with a subtle grain texture. Typography consists exclusively of crisp Monospace fonts like JetBrains Mono or Fira Code. The color palette utilizes the Catppuccin system (Lavender, Rosewater, Teal, Peach, Mauve, Sapphire, and Flamingo) to represent data volatility and market gains, replacing harsh neon colors with soothing pastels to reduce visual stress during long-term analysis.

SECTION 1: THE HERO SECTION (THE MACRO VIEW)
The top section establishes market sentiment with a focus on global blockchain state.

Background: Deep Base color (#24273A) with subtle grain.

Typography: Large, tracked-out mono-headline.

Left side: "Analyze" rendered in Lavender.

Right side: "the Long Term." rendered in Text White.

Central Graphic: A massive, rotating wireframe network sphere glowing faintly in Sapphire blue.

Navigation: Minimalist top-left links ([Dashboard], [Wallet]) in Subtext grey.

Tagline: "Algorithmic insights for the Top 100 assets."

+--------------------------------------------------+
| [>_Dashboard] |
| |
| ( Network ) |
| Analyze ( NODE ) the Long |
| ( Sphere ) Term. |
| ( ) |
| |
+--------------------------------------------------+

SECTION 2: THE ASSET BROWSER (THE TOP 100 INDEX)
A rectangular dashboard container serves as the primary asset selection tool.

Container: Mantle (slightly lighter dark) background.

Left Rail: Category icons (DeFi, L1, Gaming) in Teal.

Center-Left (List): A vertical list of top assets (BTC, ETH, SOL).

Format: 01. BTC ..... $98,432 [^]

Selection: The active item is highlighted with a Mauve background bar.

Center-Right (Graphic): A radial progress chart representing Market Cap Dominance, rendered in a gradient from Peach to Red.

Far Right (Data Column): Quick Stats displaying 200-Day Moving Average and RSI.

Button: A bright Yellow circle button with an arrow: ( v ) Scan Market.

+--------------------------------------------------+
| [=] < Index |
| [ BITCOIN // BTC ] [ RSI: 62 ] |
| |
| [1] ETH -- $3200 ( ) |
| [2] SOL -- $140 ( ) [Vol: High] |
| [3] BNB -- $600 ( DOMINANCE) [Cap: 1.2T] |
| ( CURVE ) |
| ( ) |
| [Q] ( v ) Select ( ) |
+--------------------------------------------------+

SECTION 3: THE BENTO GRID (COMPARATIVE METRICS)
A three-column grid provides deep comparative data for decision-making.

Column 1: The Deep Dive Card

Visual: A 3D Token Isometer or stylized candlestick pattern floating in void space.

Headline: >> TOKEN_OMICS_ANALYSIS in Pink.

Content: Text block analyzing inflation rates vs. staking rewards.

Footer: EST. YIELD: 4.5% in large mono numbers.

Column 2: Sentiment and Signals

Top Card: List of Buy/Sell signals (MACD/RSI). Bullish in Green, Bearish in Red.

Bottom Card: A sphere representing the Fear and Greed Index. It changes color to Flamingo pink for Extreme Greed and changes texture based on volatility.

Column 3: Visual Data

Top Card: A mini correlation heatmap showing coin movements. Squares colored in Blue (high correlation) vs Maroon (inverse).

Bottom Card: A ribbon chart representing liquidity inflows and outflows (Lava Flows style) over the last quarter.

[ DEEP DIVE ] [ SIGNALS ] [ HEATMAP ]
+-----------+ +---------+ +---------+
| // SOLANA | | > MACD | | [][][] |
| | | > RSI | | [][][] |
| /3D/ | | | | [][][] |
| /Logo/ | | (Fear) | +---------+
| | | (Index) | [ FLOWS ] |
| [Analysis]| | (Orb ) | +---------+
| [Txt blk ]| | | | ~~~~~~~ |
| | | [45/100]| | ~~~~~~~ |
+-----------+ +---------+ +---------+

SECTION 4: THE FOOTER (GLOBAL NODE MAP)
The bottom section visualizes the physical infrastructure of the blockchain.

Divider: A "Glitch" or "Data Corrupt" stylized line separating financial data from infrastructure data.

Sidebar: Text reads // INFRASTRUCTURE_LAYER.

Map: A dark silhouette of the world map.

Data Points: Glowing Rosewater and Sky blue dots indicating major mining pools and validator nodes.

Interaction: A tooltip box over "Switzerland" showing local crypto-tax laws and adoption stats in Overlay0 grey.

+--------------------------------------------------+
|             |                                    |
|  // NODES   |          .   .    .                |
|  [Active ]  |       _ ( World Map ) _            |
|  [Regions]  |      (   Validator     )           |
|             |     '   Distribution   '           |
|             |           [Zurich]                 |
+--------------------------------------------------+

Dans ce cas précis, le contenu est un site de cryptomonnaies, censé proposer des indicateurs concrets pour l’investissement moyen/long terme.

Z-Image	Nano Banana

Résultat Z-Image	Résultat Nano Banana

Les deux images obtenues sont conformes à mes attentes et sont réussies. Nano Banana gère un peu mieux les textes, même si ici ce n’est pas vraiment un critère important.

Dans les deux images, on retrouve une liste des cryptos, des indicateurs, une carte, des catégories, et même quelques assets graphiques plus sophistiqués, comme un demi-cercle représentant la dominance de marché.

Ici, Z-Image est vraiment impressionnant pour un modèle léger et open source.

2 — Prompt “Petit jeu mathématique”

L’idée ici est de générer une petite image avec des équations pour déterminer la valeur de plusieurs variables.

Generate a math problem image with banana, tree , robot, 
with the goal of finding the value of robot base on 
other equations with tree, banana and robot as variables.

Z-Image	Nano Banana

Résultat Z-Image	Résultat Nano Banana

Z-Image n’y arrive pas : on a bien les éléments demandés, mais la composition est mauvaise et pas cohérente.

Du côté de Nano Banana, c’est très bon dès le premier essai : on a bien les équations et tous les éléments nécessaires.

J’ai préparé une deuxième version du prompt, cette fois spécifiquement pour aider Z-Image : le prompt décrit précisément les équations et la composition pour guider le modèle.

Visual Overview
The
 image is a vertical graphic containing a visual algebra puzzle. It uses
 cartoon-style icons on a plain white background. There are four lines 
of mathematical equations.The IconsBanana: A bright yellow, curved fruit with a small brown stem at the top.Robot: A grey, metallic figure with a square head, bolted joints, and a glowing antenna.Tree: A nature icon featuring a sturdy brown trunk and a large, fluffy cloud of green leaves.The Equations (Line by Line)Row 1: Three Bananas are added together to equal 12.(Equation: Banana + Banana + Banana = 12)Row 2: A Robot plus a Banana equals 10.(Equation: Robot + Banana = 10)Row 3: A Tree minus a Robot equals 3.(Equation: Tree - Robot = 3)Row 4: A Banana plus a Tree plus a Robot equals ? (A pink question mark).(Equation: Banana + Tree + Robot = ?)

Et cette fois, le résultat est parfait.

3 — Connaissance du monde

Cette série de prompts teste la capacité des modèles à comprendre le monde réel : les lieux, les personnes, les personnages, et les plats.

L’idée est de voir si un modèle léger est capable d’avoir une connaissance suffisamment développée.

3.1 — Connaissance des lieux : Zhangjiajie

On commence avec les montagnes de Zhangjiajie.

an aerial photo of zhangjiajie mountains with minimap on the top left corner
with a pin on the location on a world map.

Z-Image	Nano Banana

Résultat Z-Image	Résultat Nano Banana

Z-Image Turbo produit une bonne composition générale, mais les détails sont incorrects : il rajoute des temples et des maisons sur les montagnes, ce qui n’a rien à voir avec la réalité. De plus, la carte générée n’est pas une vraie carte du monde, mais un zoom de type Google Maps.

Nano Banana, lui, s’en sort très bien : le seul problème est qu’il génère plusieurs images séparées plutôt qu’une seule, avec d’un côté la carte et le pin, et de l’autre la vue des montagnes.

3.2 — Connaissance des personnes réelles

Le test suivant utilise des personnes réelles et connues, avec une composition contenant plusieurs visages.

Steve jobs, Mark zuckerberg, Elon Musk and Jeff Bezos celebrating Christmas together.
The scene is by a fireblace with a christmas tree . 
They all have Christmas sweater

Nano Banana refuse de générer l’image. Z-Image la génère, avec une bonne composition, mais les ressemblances ne sont pas fidèles : deux personnages sont à peu près corrects, mais globalement c’est mauvais.

3.3 — Personnages non réels (animés)

On teste maintenant des personnages d’animé, issus de Dragon Ball Z, avec une composition à quatre personnages.

Anime image of Son Goku, trunks and son Goten and vegeta.
They are training together at the gym

Z-Image	Nano Banana

Résultat Z-Image	Résultat Nano Banana

Z-Image s’en sort bien pour la composition générale, mais seuls deux personnages sont valides ; les deux autres sont incorrects.

Nano Banana, lui, génère une image correcte avec tous les éléments présents, même si elle n’est pas parfaite.

3.4 — Connaissance du monde réel : la nourriture

Le test le plus difficile selon moi.

On veut voir si le modèle peut générer des plats traditionnels français.

top view of a table with the following dishes on it:
- croque madame
- boeuf bourguignon
- tartiflette
- tarte tatin

Z-Image	Nano Banana

Résultat Z-Image	Résultat Nano Banana

Sans surprise, Z-Image n’y arrive pas : les plats ne ressemblent pas à ce qu’ils devraient être. Nano Banana les génère parfaitement, sans erreur.

On peut donc dire que, concernant la connaissance du monde réel, Z-Image est nettement en dessous, ce qui est normal pour un modèle aussi léger. De plus, on a volontairement choisi des compositions avancées. Avec des scènes plus simples et une description plus détaillée, Z-Image pourrait probablement obtenir de bons résultats.

4 — Prompts plus abstraits et originaux

On passe maintenant à des prompts plus créatifs.

4.1 — Wallpaper

Ici, j’ai utilisé un prompt tel quel qui avait servi à générer une image avec un ancien modèle basé sur Stable Diffusion. Le prompt est donc moins narratif : il est composé de mots-clés et de tags plutôt que d’une description en langage naturel.

L’objectif était de voir si on peut obtenir un super wallpaper avec ces modèles et ce type de prompt.

newfantasycore,dutch angle,Create a masterpiece,
 best quality newfantasycore illustration of a skeleton knight resting beneath a massive, 
 blooming cherry blossom tree. 
 The moon glows softly in the background, casting serene light over the scene. 
 The knight’s ornate longsword is stabbed firmly into the ground beside him, 
 while his skeletal form is draped in vibrant, 
 colorful flowers, petals drifting gently through the air. 
 He sits in a peaceful yet melancholic pose, 
 surrounded by a lush spring meadow alive with blooming flowers. 
 Cinematic lighting enhances the ethereal fantasy atmosphere, 
 with glowing colors highlighting intricate details of the skeleton, 
 blossoms, and ornate sword. The composition balances tranquility and solemnity, 
 capturing a mystical, anime-inspired fantasy world full of beauty, life, 
 and quiet emotion.

Z-Image	Nano Banana

Résultat Z-Image	Résultat Nano Banana

Pour Z-Image, c’est excellent : l’image ferait un très bon wallpaper. Pour Nano Banana, c’est un peu moins bon selon moi : la composition est correcte, mais l’image est plus chargée et semble moins propre.

4.2 — Création imaginaire

Cette fois, l’idée est de créer une image d’une chenille faite à partir de tranches de pomme.

A charming, tiny caterpillar made entirely from small apple segments 
crawls slowly across a wooden picnic table in the warm afternoon sun. 
Its segmented body is composed of crescent-shaped slices of red apple, 
each piece carefully aligned to curve naturally like a caterpillar’s 
body. The apple skin faces outward, giving the creature a glossy red 
finish, while the exposed white flesh adds contrast along its 
underbelly. Its face is a rounded, slightly larger apple chunk with two 
small dark seeds set as curious eyes and a gentle carved smile. Two tiny
 green mint leaves protrude as antennae. The surface of the apple is 
slightly moist, catching the light and showing fresh texture. The 
setting is rustic: wood grain beneath, a blurred grassy field in the 
background, and soft dappled sunlight creating gentle shadows. The image
 is framed in macro, focused on the caterpillar’s head with shallow 
depth of field for a cozy, natural feel.

Z-Image	Nano Banana

Résultat Z-Image	Résultat Nano Banana

Je savais que le résultat serait très bon avec Z-Image, puisque j’ai copié le prompt tel quel depuis une collection d’images réalisées avec ce modèle.

Nano Banana génère une image très similaire : un peu moins propre, mais plus réaliste.

4.3 — Salamèche 2D dans une boîte d’œufs

Le dernier prompt : un Salamèche en 2D, fait au crayon, qui sortirait d’une boîte à œufs.

On a donc un prompt avec de la compréhension du monde (Salamèche), une composition sophistiquée et originale. Ce prompt a été copié depuis une collection d’images, mais cette fois il avait été généré avec Nano Banana. Je l’ai choisi car il est très détaillé et assez complexe.

A cute cartoon Charmander hatching from a small white egg, 
which is resting within an opened egg carton.
The carton contains a full dozen fresh eggs, as it sits on a kitchen counter.
The Charmander is a 2D cartoon sketched from colored pencils. 
The all eggs, egg carton, counter top, and background are all photorealistic, 
made to resemble real life. 
Charmander hatches from a real egg, 
although he himself is a 2D drawn and cut out outline. 
On top of his head is a part of the shell, like a hat.

Z-Image	Nano Banana

Résultat Z-Image	Résultat Nano Banana

Les deux modèles produisent un résultat similaire, même si Nano Banana respecte plus précisément les éléments. Mais dans ce cas, le choix du “meilleur” dépend surtout de vos préférences.

5 — Tirer parti des deux modèles

Avec ces résultats, on peut déterminer comment tirer le meilleur de chaque modèle.

Si vous avez une image précise en tête, et que vous pouvez la décrire clairement, avec un ou deux personnages maximum, alors Z-Image sera équivalent, voire supérieur à Nano Banana.

En revanche, si vous avez seulement une vague idée de l’image que vous souhaitez obtenir, Nano Banana est nécessaire. La “réflexion” du modèle l’aide à gérer la composition et à extrapoler les détails à partir d’un prompt simple.

Nano Banana est plus capable de gérer :

✔ les scènes complexes
✔ plusieurs personnages
✔ les lieux réels
✔ et globalement une meilleure connaissance du monde

Cependant, vous avez beaucoup plus de contrôle avec un modèle open source via ComfyUI.

Conclusion

Même si le budget n’est pas un critère pour vous, je vous conseille quand même de générer les images adaptées avec Z-Image, puis éventuellement d’ajouter des améliorations avec d’autres modèles open source, des LoRAs ou du post-processing.

Critère	Z-Image Turbo	Nano Banana Pro
Type	Open source, léger	Closed source, très puissant
Coût	Quasi gratuit	Payant (peu cher), limites quotidiennes
Textes	Moyen sur phrases longues	Très bon
Compréhension du monde	Limitée	Excellente
Compositions complexes	Difficile	Très bon
Prompting	Nécessite beaucoup de détails	Gère les prompts courts
Contrôle via ComfyUI	Excellent	Aucun
Rapidité	Très rapide (local)	Variable selon API
Fidélité artistique	Très bonne sur prompts précis	Excellente et robuste