Apr 25, 2026 · 12 min de leitura
GPT-image-2 vs DALL·E 3 vs Midjourney v7: benchmark com 50 prompts
Rodamos os mesmos 50 prompts em três modelos. Aqui está onde cada um vence e onde cada um falha.
Configuração do benchmark: 50 prompts padronizados em 5 categorias — retratos fotorrealistas, staging de produto, ilustração, arquitetura e abstrato. Cada prompt rodado de forma idêntica no GPT-image-2 (qualidade medium), DALL·E 3 e Midjourney v7. Avaliados por 3 juízes, escala de 1–5, em fidelidade ao prompt e qualidade estética. Lista completa de prompts e saídas no final.
Os números principais
- Fidelidade ao prompt: GPT-image-2 4.4 / DALL·E 3 3.6 / Midjourney v7 3.2.
- Qualidade estética: GPT-image-2 4.1 / DALL·E 3 3.7 / Midjourney v7 4.5.
- Combinada: GPT-image-2 4.25 / Midjourney v7 3.85 / DALL·E 3 3.65.
Por categoria
Retratos fotorrealistas
O GPT-image-2 vence na aderência ao prompt — idade, expressão e roupa certas. O Midjourney vence na estética; os retratos parecem mais 'magazine'. O DALL·E 3 ficou para trás nos dois.
Staging de produto
Aqui o GPT-image-2 domina. Tanto o DALL·E 3 quanto o Midjourney costumam inventar características do produto a partir de uma descrição em texto; o GPT-image-2 foi rigoroso.
Ilustração
O Midjourney v7 vence essa categoria com folga — o estilo da casa é o seu ponto forte.
Arquitetura
O GPT-image-2 vence em consistência geométrica. Os outros dois desviam em perspectiva e proporções em prompts longos.
Abstrato
Praticamente empatados. Os três produziram imagens marcantes. Escolha pela estética pessoal.
Ajustado por custo
Custo por imagem importa. O Midjourney sai por cerca de $0,06 por imagem em um plano Standard; DALL·E 3 ~$0,04 (ou 'grátis' dentro do ChatGPT Plus); GPT-image-2 medium ~$0,05. Estão todos próximos o bastante para que a qualidade guie a escolha, e não o preço.
O que de fato usaríamos
- Ilustração editorial / com marca: Midjourney v7.
- Mockups de produto, stills publicitários, qualquer coisa em que fidelidade ao prompt importe: GPT-image-2.
- Usuários casuais do ChatGPT que não pagam contas separadas de API: o DALL·E 3 segue útil.