Apr 25, 2026 · 閱讀約 12 分鐘
GPT-image-2 對比 DALL·E 3 對比 Midjourney v7:50 題實測
我們把同樣 50 個提示詞跑過三個模型。誰贏在哪、誰在哪裡掉鏈子,一次看完。
實測設定:50 個標準提示詞、5 個類別 — 擬真人像、商品擺拍、插畫、建築、抽象。每個提示詞都用同樣的內容跑過 GPT-image-2(medium 畫質)、DALL·E 3、Midjourney v7。3 位評審用 1–5 分量表,從提示詞還原度與美感品質兩個面向打分。完整提示詞清單與輸出附在最下方。
頭條數字
- 提示詞還原度:GPT-image-2 4.4 / DALL·E 3 3.6 / Midjourney v7 3.2。
- 美感品質:GPT-image-2 4.1 / DALL·E 3 3.7 / Midjourney v7 4.5。
- 綜合:GPT-image-2 4.25 / Midjourney v7 3.85 / DALL·E 3 3.65。
依類別分析
擬真人像
GPT-image-2 在提示詞還原度上勝出 — 年齡、表情、服裝都對。Midjourney 贏在美感;人像看起來更「雜誌感」。DALL·E 3 兩面都落後。
商品擺拍
GPT-image-2 在這個類別大勝。DALL·E 3 和 Midjourney 拿到文字描述時常常會自己加商品功能;GPT-image-2 比較守規矩。
插畫
Midjourney v7 在這個類別大幅領先 — 它的家族風格就是它的強項。
建築
GPT-image-2 在幾何一致性上贏。另外兩個在長提示詞下,透視和比例會跑掉。
抽象
大致打平。三家都生出搶眼的圖。看你個人的美感喜好挑就好。
成本校準後
單張成本也要看。Midjourney 在 Standard 方案下大約每張 $0.06;DALL·E 3 約 $0.04(或在 ChatGPT Plus 內「免費」);GPT-image-2 medium 約 $0.05。三家其實都很接近,所以該由畫質決勝負,不是價格。
我們實際會挑誰
- 編輯型 / 品牌插畫:Midjourney v7。
- 商品 mockup、廣告靜物、任何重視提示詞還原度的場景:GPT-image-2。
- 沒有額外付 API 帳單的 ChatGPT 一般用戶:DALL·E 3 還是好用。