Apr 25, 2026 · 12 Min. Lesezeit
GPT-image-2 vs DALL·E 3 vs Midjourney v7: 50-Prompt-Benchmark
Wir haben dieselben 50 Prompts durch drei Modelle laufen lassen. Hier siehst du, wo jedes gewinnt und wo sie scheitern.
Benchmark-Setup: 50 standardisierte Prompts in 5 Kategorien — fotorealistische Porträts, Produkt-Staging, Illustration, Architektur und Abstrakt. Jeder Prompt identisch durch GPT-image-2 (medium quality), DALL·E 3 und Midjourney v7. Bewertet von 3 Bewertenden, Skala 1–5, nach Prompt-Treue und ästhetischer Qualität. Vollständige Promptliste und Outputs am Ende.
Headline-Zahlen
- Prompt-Treue: GPT-image-2 4,4 / DALL·E 3 3,6 / Midjourney v7 3,2.
- Ästhetische Qualität: GPT-image-2 4,1 / DALL·E 3 3,7 / Midjourney v7 4,5.
- Kombiniert: GPT-image-2 4,25 / Midjourney v7 3,85 / DALL·E 3 3,65.
Nach Kategorie
Fotorealistische Porträts
GPT-image-2 gewinnt bei der Prompt-Treue — das richtige Alter, der Ausdruck und die Kleidung. Midjourney gewinnt bei der Ästhetik; Porträts wirken eher 'magazinhaft'. DALL·E 3 hinkt bei beidem hinterher.
Produkt-Staging
GPT-image-2 dominiert hier. Sowohl DALL·E 3 als auch Midjourney erfinden bei einer schriftlichen Beschreibung oft Produktmerkmale; GPT-image-2 war strikt.
Illustration
Midjourney v7 gewinnt diese Kategorie mit großem Abstand — sein Hausstil ist seine Stärke.
Architektur
GPT-image-2 gewinnt bei geometrischer Konsistenz. Die anderen beiden driften bei Perspektive und Proportionen in langen Prompts.
Abstrakt
Grob unentschieden. Alle drei lieferten markante Bilder. Wähl nach persönlicher Ästhetik.
Kostenbereinigt
Die Kosten pro Bild zählen. Midjourney liegt im Standard-Plan bei rund $0,06 pro Bild; DALL·E 3 bei ~$0,04 (oder 'gratis' innerhalb von ChatGPT Plus); GPT-image-2 medium bei ~$0,05. Sie liegen alle nah genug beieinander, dass die Wahl von der Qualität getrieben werden sollte, nicht vom Preis.
Was wir tatsächlich nutzen würden
- Editorial / Branded Illustration: Midjourney v7.
- Produkt-Mockups, Werbe-Stills, alles, wo Prompt-Treue zählt: GPT-image-2.
- Lockere ChatGPT-Nutzer:innen ohne separate API-Rechnungen: DALL·E 3 bleibt nützlich.