Apr 25, 2026 · 阅读约 12 分钟

GPT-image-2 对比 DALL·E 3 与 Midjourney v7:50 条提示词实测

我们用同样的 50 条提示词跑了三个模型。哪一个在哪赢、在哪翻车,都在这里。

测试设置:50 条标准化提示词,覆盖 5 个品类 — 照片级人像、产品摆拍、插画、建筑、抽象。每条提示词分别用 GPT-image-2(medium 画质)、DALL·E 3 和 Midjourney v7 完全相同地跑一次。3 名打分员,1–5 分制,从提示词还原度和审美质量两个维度打分。完整提示词清单与输出在文末。

总分

提示词还原度:GPT-image-2 4.4 / DALL·E 3 3.6 / Midjourney v7 3.2。
审美质量:GPT-image-2 4.1 / DALL·E 3 3.7 / Midjourney v7 4.5。
综合:GPT-image-2 4.25 / Midjourney v7 3.85 / DALL·E 3 3.65。

分品类

照片级人像

GPT-image-2 在提示词遵循上胜出 — 年龄、表情、服装都对。Midjourney 在审美上胜出;人像更有 '杂志感'。DALL·E 3 在两个维度上都落后。

产品摆拍

这一格 GPT-image-2 完全压制。DALL·E 3 和 Midjourney 拿到一段文字描述时经常会自己脑补产品特征;GPT-image-2 很守规矩。

插画

Midjourney v7 大幅领先 — 它的家族风格就是它的强项。

建筑

GPT-image-2 在几何一致性上胜出。另外两个在长提示下会出现透视和比例漂移。

抽象

大致打平。三家都能产出有冲击力的画面。看个人审美选就行。

成本视角

单图成本要算的。Midjourney 在 Standard 套餐下大约是每张 $0.06;DALL·E 3 大约 $0.04(或在 ChatGPT Plus 里 '免费');GPT-image-2 medium 大约 $0.05。三者足够接近,选谁应该看画质,而不是看价格。

我们自己实际会怎么用

杂志风 / 品牌插画:Midjourney v7。
产品样机、广告静帧,以及任何提示词还原度重要的场景:GPT-image-2。
随手用 ChatGPT、不想单独付 API 账单的休闲用户:DALL·E 3 仍然有用。

总分

分品类

照片级人像

产品摆拍

插画

建筑

抽象

成本视角

我们自己实际会怎么用

别再对着空白画布发呆。