Apr 22, 2026 · 9분 분량
GPT-image-2는 실제로 어떻게 동작할까 (크리에이터를 위한 실용 가이드)
GPT-image-2는 OpenAI의 최신 이미지 모델이에요. 크리에이터를 위한 실용 가이드 — DALL·E 3에서 무엇이 바뀌었고, 내부적으로 무엇이 새로워졌으며, 실제로 어떻게 프롬프트를 쓰는지 정리했어요.
OpenAI는 2026년 4월 21일 DALL·E 시리즈의 후속으로 gpt-image-2를 공개했어요. ChatGPT와 긴밀하게 묶여 있던 DALL·E 3와 달리, gpt-image-2는 공개 출시와 같은 주에 정식 API 모델로 출시됐어요. 이 점이 품질, 컨트롤할 수 있는 범위, 그리고 어떤 작업에 잘 맞는지에 영향을 줘요.
DALL·E 3와 비교해서 무엇이 새로운가
- 더 높은 네이티브 해상도: 기본 1024², 필요할 때 2K HD 내장 지원.
- 더 좋은 프롬프트 충실도: 복잡한 프롬프트(다중 피사체, 공간 관계)가 실제로 잘 동작해요.
- 이미지 입력은 고해상도 그대로 — 업로드한 레퍼런스가 읽히기 전에 다운샘플링되지 않아요.
- 토큰 기반 가격: 이미지 입력 $8/M, 이미지 출력 $30/M — 예측 가능하고 확장하기 좋아요.
세 가지 품질 단계, 세 가지 가격대
GPT-image-2는 'low', 'medium', 'high' 세 가지 품질 옵션을 제공해요. 각각 이미지당 가격이 달라요: 1024²에서 $0.006 / $0.053 / $0.211. 일상 작업에는 거의 항상 medium이 좋아요 — high는 '깔끔한 웹 이미지'와 '잡지 표지'를 가르는 차이예요. low는 아이데이션용으로, 빠르고 저렴하지만 거친 면이 보일 거예요.
이미지 편집이 실제로 동작해요
DALL·E 3는 생성만 됐어요. GPT-image-2는 업로드한 이미지와 프롬프트를 받아 일관된 편집 결과를 돌려줘요. 마스킹, 라이팅, 원근 일관성을 모델이 내부에서 처리해 줘서 ControlNet이나 인페인팅 워크플로가 필요 없어요. 정밀한 편집에는 마스크를 그려주면 도움이 되지만, 선택 사항이에요.
성과를 높이는 다섯 가지 프롬프트 습관
- 피사체로 시작하세요. '화성에 있는 여우 우주비행사.' '여우가 등장하는 이미지를 만들어 줘…'가 아니라요.
- 다음으로 카메라와 라이팅을 명시하세요: '35mm, 부드러운 림 라이트, 골든 아워'.
- 스타일 앵커로 마무리하세요: 'editorial photography', 'Studio Ghibli', 'flat illustration'.
- 평이한 영어로 부정 표현(예: "don't include…")을 쓰지 말고, 원하는 것을 명시하세요.
- HD에서는 더 구체적으로 쓰세요. 모델의 여유가 더 크고, 지시를 더 그대로 따라요.
GPT-image-2를 쓰지 않는 게 좋은 경우
특정 애니메이션 파인튜닝, 특정 LoRA, 또는 완전한 로컬 컨트롤이 필요하다면 여전히 Stable Diffusion이 적합해요. 이미 Midjourney를 쓰고 그 하우스 스타일이 마음에 든다면 그대로 써도 돼요. GPT-image-2의 강점은 신뢰성이에요 — 묘사한 대로 만들어 줘요.
비용 가이드
한 달에 표준 이미지 100장을 만드는 일반 크리에이터의 OpenAI 원가는 약 $5.30 정도예요. gptimage2.plus 같은 매니지드 서비스에서는 월 ~$10 수준이 되는데, 그 차이는 인프라, 지원, 콘텐츠 모더레이션, 그리고 (저희의 경우) 무료 호스팅 생성 히스토리를 커버해요.