Apr 25, 2026 · 閱讀約 12 分鐘

GPT-image-2 對比 DALL·E 3 對比 Midjourney v7:50 題實測

我們把同樣 50 個提示詞跑過三個模型。誰贏在哪、誰在哪裡掉鏈子,一次看完。

實測設定:50 個標準提示詞、5 個類別 — 擬真人像、商品擺拍、插畫、建築、抽象。每個提示詞都用同樣的內容跑過 GPT-image-2(medium 畫質)、DALL·E 3、Midjourney v7。3 位評審用 1–5 分量表,從提示詞還原度與美感品質兩個面向打分。完整提示詞清單與輸出附在最下方。

頭條數字

提示詞還原度:GPT-image-2 4.4 / DALL·E 3 3.6 / Midjourney v7 3.2。
美感品質:GPT-image-2 4.1 / DALL·E 3 3.7 / Midjourney v7 4.5。
綜合:GPT-image-2 4.25 / Midjourney v7 3.85 / DALL·E 3 3.65。

依類別分析

擬真人像

GPT-image-2 在提示詞還原度上勝出 — 年齡、表情、服裝都對。Midjourney 贏在美感;人像看起來更「雜誌感」。DALL·E 3 兩面都落後。

商品擺拍

GPT-image-2 在這個類別大勝。DALL·E 3 和 Midjourney 拿到文字描述時常常會自己加商品功能;GPT-image-2 比較守規矩。

插畫

Midjourney v7 在這個類別大幅領先 — 它的家族風格就是它的強項。

建築

GPT-image-2 在幾何一致性上贏。另外兩個在長提示詞下,透視和比例會跑掉。

抽象

大致打平。三家都生出搶眼的圖。看你個人的美感喜好挑就好。

成本校準後

單張成本也要看。Midjourney 在 Standard 方案下大約每張 $0.06;DALL·E 3 約 $0.04(或在 ChatGPT Plus 內「免費」);GPT-image-2 medium 約 $0.05。三家其實都很接近,所以該由畫質決勝負,不是價格。

我們實際會挑誰

編輯型 / 品牌插畫:Midjourney v7。
商品 mockup、廣告靜物、任何重視提示詞還原度的場景:GPT-image-2。
沒有額外付 API 帳單的 ChatGPT 一般用戶:DALL·E 3 還是好用。