Apr 25, 2026 · 12분 분량

GPT-image-2 vs DALL·E 3 vs Midjourney v7: 50개 프롬프트 벤치마크

같은 프롬프트 50개를 세 모델에 돌렸어요. 각 모델이 어디서 이기고 어디서 무너지는지 정리했어요.

벤치마크 셋업: 5개 카테고리(포토리얼 포트레이트, 제품 스테이징, 일러스트, 건축, 추상) 전반에 걸친 50개 표준화 프롬프트. 각 프롬프트를 GPT-image-2(medium 품질), DALL·E 3, Midjourney v7에 동일하게 실행했어요. 평가자 3명이 1–5점 척도로 프롬프트 충실도와 미적 품질을 매겼어요. 전체 프롬프트 목록과 결과물은 글 하단에 있어요.

헤드라인 수치

프롬프트 충실도: GPT-image-2 4.4 / DALL·E 3 3.6 / Midjourney v7 3.2.
미적 품질: GPT-image-2 4.1 / DALL·E 3 3.7 / Midjourney v7 4.5.
종합: GPT-image-2 4.25 / Midjourney v7 3.85 / DALL·E 3 3.65.

카테고리별

포토리얼 포트레이트

GPT-image-2가 프롬프트 준수에서 이겨요 — 정확한 나이, 표정, 의상. Midjourney는 미적 측면에서 이기고요, 인물 사진이 더 '잡지처럼' 보여요. DALL·E 3는 두 항목 모두에서 뒤처졌어요.

제품 스테이징

여기서는 GPT-image-2가 압도해요. DALL·E 3와 Midjourney는 글로 묘사한 제품 특징을 종종 임의로 만들어 내는데, GPT-image-2는 엄격하게 따라요.

일러스트

이 카테고리는 Midjourney v7이 큰 격차로 이겨요 — 하우스 스타일이 곧 강점이에요.

건축

GPT-image-2가 기하 일관성에서 이겨요. 다른 둘은 긴 프롬프트에서 원근과 비례가 흔들려요.

추상

거의 비슷해요. 셋 다 인상적인 이미지를 만들었어요. 개인 취향으로 고르세요.

비용 보정

이미지당 비용도 중요해요. Midjourney는 Standard 플랜에서 이미지당 대략 $0.06; DALL·E 3는 ~$0.04(또는 ChatGPT Plus 안에서는 '무료'); GPT-image-2 medium은 ~$0.05 정도예요. 모두 비슷해서 가격이 아니라 품질로 골라야 해요.

실제로 우리가 쓰겠다면

에디토리얼/브랜드 일러스트: Midjourney v7.
제품 목업, 광고 스틸, 프롬프트 충실도가 중요한 모든 것: GPT-image-2.
별도 API 비용을 내지 않는 캐주얼한 ChatGPT 사용자: DALL·E 3는 여전히 유용해요.