Apr 25, 2026 · 12 Min. Lesezeit

GPT-image-2 vs DALL·E 3 vs Midjourney v7: 50-Prompt-Benchmark

Wir haben dieselben 50 Prompts durch drei Modelle laufen lassen. Hier siehst du, wo jedes gewinnt und wo sie scheitern.

Benchmark-Setup: 50 standardisierte Prompts in 5 Kategorien — fotorealistische Porträts, Produkt-Staging, Illustration, Architektur und Abstrakt. Jeder Prompt identisch durch GPT-image-2 (medium quality), DALL·E 3 und Midjourney v7. Bewertet von 3 Bewertenden, Skala 1–5, nach Prompt-Treue und ästhetischer Qualität. Vollständige Promptliste und Outputs am Ende.

Headline-Zahlen

Prompt-Treue: GPT-image-2 4,4 / DALL·E 3 3,6 / Midjourney v7 3,2.
Ästhetische Qualität: GPT-image-2 4,1 / DALL·E 3 3,7 / Midjourney v7 4,5.
Kombiniert: GPT-image-2 4,25 / Midjourney v7 3,85 / DALL·E 3 3,65.

Nach Kategorie

Fotorealistische Porträts

GPT-image-2 gewinnt bei der Prompt-Treue — das richtige Alter, der Ausdruck und die Kleidung. Midjourney gewinnt bei der Ästhetik; Porträts wirken eher 'magazinhaft'. DALL·E 3 hinkt bei beidem hinterher.

Produkt-Staging

GPT-image-2 dominiert hier. Sowohl DALL·E 3 als auch Midjourney erfinden bei einer schriftlichen Beschreibung oft Produktmerkmale; GPT-image-2 war strikt.

Illustration

Midjourney v7 gewinnt diese Kategorie mit großem Abstand — sein Hausstil ist seine Stärke.

Architektur

GPT-image-2 gewinnt bei geometrischer Konsistenz. Die anderen beiden driften bei Perspektive und Proportionen in langen Prompts.

Abstrakt

Grob unentschieden. Alle drei lieferten markante Bilder. Wähl nach persönlicher Ästhetik.

Kostenbereinigt

Die Kosten pro Bild zählen. Midjourney liegt im Standard-Plan bei rund $0,06 pro Bild; DALL·E 3 bei ~$0,04 (oder 'gratis' innerhalb von ChatGPT Plus); GPT-image-2 medium bei ~$0,05. Sie liegen alle nah genug beieinander, dass die Wahl von der Qualität getrieben werden sollte, nicht vom Preis.

Was wir tatsächlich nutzen würden

Editorial / Branded Illustration: Midjourney v7.
Produkt-Mockups, Werbe-Stills, alles, wo Prompt-Treue zählt: GPT-image-2.
Lockere ChatGPT-Nutzer:innen ohne separate API-Rechnungen: DALL·E 3 bleibt nützlich.