Apr 25, 2026 · 12 min de leitura

GPT-image-2 vs DALL·E 3 vs Midjourney v7: benchmark com 50 prompts

Rodamos os mesmos 50 prompts em três modelos. Aqui está onde cada um vence e onde cada um falha.

Configuração do benchmark: 50 prompts padronizados em 5 categorias — retratos fotorrealistas, staging de produto, ilustração, arquitetura e abstrato. Cada prompt rodado de forma idêntica no GPT-image-2 (qualidade medium), DALL·E 3 e Midjourney v7. Avaliados por 3 juízes, escala de 1–5, em fidelidade ao prompt e qualidade estética. Lista completa de prompts e saídas no final.

Os números principais

Fidelidade ao prompt: GPT-image-2 4.4 / DALL·E 3 3.6 / Midjourney v7 3.2.
Qualidade estética: GPT-image-2 4.1 / DALL·E 3 3.7 / Midjourney v7 4.5.
Combinada: GPT-image-2 4.25 / Midjourney v7 3.85 / DALL·E 3 3.65.

Por categoria

Retratos fotorrealistas

O GPT-image-2 vence na aderência ao prompt — idade, expressão e roupa certas. O Midjourney vence na estética; os retratos parecem mais 'magazine'. O DALL·E 3 ficou para trás nos dois.

Staging de produto

Aqui o GPT-image-2 domina. Tanto o DALL·E 3 quanto o Midjourney costumam inventar características do produto a partir de uma descrição em texto; o GPT-image-2 foi rigoroso.

Ilustração

O Midjourney v7 vence essa categoria com folga — o estilo da casa é o seu ponto forte.

Arquitetura

O GPT-image-2 vence em consistência geométrica. Os outros dois desviam em perspectiva e proporções em prompts longos.

Abstrato

Praticamente empatados. Os três produziram imagens marcantes. Escolha pela estética pessoal.

Ajustado por custo

Custo por imagem importa. O Midjourney sai por cerca de $0,06 por imagem em um plano Standard; DALL·E 3 ~$0,04 (ou 'grátis' dentro do ChatGPT Plus); GPT-image-2 medium ~$0,05. Estão todos próximos o bastante para que a qualidade guie a escolha, e não o preço.

O que de fato usaríamos

Ilustração editorial / com marca: Midjourney v7.
Mockups de produto, stills publicitários, qualquer coisa em que fidelidade ao prompt importe: GPT-image-2.
Usuários casuais do ChatGPT que não pagam contas separadas de API: o DALL·E 3 segue útil.