Apr 25, 2026 · 阅读约 12 分钟
GPT-image-2 对比 DALL·E 3 与 Midjourney v7:50 条提示词实测
我们用同样的 50 条提示词跑了三个模型。哪一个在哪赢、在哪翻车,都在这里。
测试设置:50 条标准化提示词,覆盖 5 个品类 — 照片级人像、产品摆拍、插画、建筑、抽象。每条提示词分别用 GPT-image-2(medium 画质)、DALL·E 3 和 Midjourney v7 完全相同地跑一次。3 名打分员,1–5 分制,从提示词还原度和审美质量两个维度打分。完整提示词清单与输出在文末。
总分
- 提示词还原度:GPT-image-2 4.4 / DALL·E 3 3.6 / Midjourney v7 3.2。
- 审美质量:GPT-image-2 4.1 / DALL·E 3 3.7 / Midjourney v7 4.5。
- 综合:GPT-image-2 4.25 / Midjourney v7 3.85 / DALL·E 3 3.65。
分品类
照片级人像
GPT-image-2 在提示词遵循上胜出 — 年龄、表情、服装都对。Midjourney 在审美上胜出;人像更有 '杂志感'。DALL·E 3 在两个维度上都落后。
产品摆拍
这一格 GPT-image-2 完全压制。DALL·E 3 和 Midjourney 拿到一段文字描述时经常会自己脑补产品特征;GPT-image-2 很守规矩。
插画
Midjourney v7 大幅领先 — 它的家族风格就是它的强项。
建筑
GPT-image-2 在几何一致性上胜出。另外两个在长提示下会出现透视和比例漂移。
抽象
大致打平。三家都能产出有冲击力的画面。看个人审美选就行。
成本视角
单图成本要算的。Midjourney 在 Standard 套餐下大约是每张 $0.06;DALL·E 3 大约 $0.04(或在 ChatGPT Plus 里 '免费');GPT-image-2 medium 大约 $0.05。三者足够接近,选谁应该看画质,而不是看价格。
我们自己实际会怎么用
- 杂志风 / 品牌插画:Midjourney v7。
- 产品样机、广告静帧,以及任何提示词还原度重要的场景:GPT-image-2。
- 随手用 ChatGPT、不想单独付 API 账单的休闲用户:DALL·E 3 仍然有用。