Apr 22, 2026 · 9 mnt baca

Bagaimana GPT-image-2 Sebenarnya Bekerja (Panduan Praktis untuk Kreator)

GPT-image-2 adalah model gambar terbaru dari OpenAI. Berikut panduan praktis untuk kreator — apa yang berubah dari DALL·E 3, apa yang baru di balik layar, dan cara memberikan prompt yang sebenarnya.

OpenAI merilis gpt-image-2 pada 21 April 2026, penerus seri DALL·E. Berbeda dengan DALL·E 3 yang terintegrasi erat dengan ChatGPT, gpt-image-2 hadir sebagai model API kelas satu pada minggu yang sama dengan rilis publiknya. Hal itu membawa konsekuensi — terhadap kualitas, terhadap apa yang dapat Anda kontrol, dan terhadap jenis pekerjaan yang cocok untuknya.

Apa yang baru dibandingkan DALL·E 3

Resolusi native lebih tinggi: 1024² langsung dari awal, dengan 2K HD bawaan sesuai permintaan.
Kesetiaan prompt yang lebih baik: prompt kompleks (multi-subjek, hubungan spasial) benar-benar berfungsi.
Dukungan input gambar berkualitas tinggi — referensi yang diunggah tidak diturunkan resolusinya sebelum dibaca.
Penetapan harga berbasis token: $8/M input gambar, $30/M output gambar — dapat diprediksi dan skalabel.

Tiga tingkatan kualitas, tiga titik harga

GPT-image-2 menyediakan setelan kualitas 'low', 'medium', dan 'high'. Masing-masing memetakan ke biaya per gambar yang berbeda: $0.006 / $0.053 / $0.211 pada 1024². Anda hampir selalu menginginkan medium untuk pekerjaan kasual — high adalah selisih antara 'gambar web yang tajam' dan 'sampul majalah'. Low cocok untuk ideasi: murah-dan-cepat, harap maklum dengan tepi yang kasar.

Pengeditan gambar benar-benar berfungsi

DALL·E 3 hanya untuk pembuatan. GPT-image-2 menerima gambar yang diunggah ditambah prompt dan mengembalikan suntingan yang koheren. Model menangani masking, pencahayaan, dan koherensi perspektif secara internal — Anda tidak memerlukan alur kerja ControlNet atau inpainting. Melukis mask masih membantu untuk suntingan yang presisi, tetapi sifatnya opsional.

Lima kebiasaan prompting yang membuahkan hasil

Mulai dengan subjek. 'Seekor rubah astronaut di Mars.' Bukan 'Buatkan saya gambar di mana ada rubah…'
Sebutkan kamera + pencahayaan berikutnya: '35mm, soft rim light, golden hour'.
Akhiri dengan jangkar gaya: 'editorial photography', 'Studio Ghibli', 'flat illustration'.
Hindari prompting negatif dalam bahasa Inggris biasa ('don't include…') — sebutkan apa yang Anda INGINKAN sebagai gantinya.
Untuk HD, lebih spesifiklah. Model memiliki ruang lebih banyak dan mengikuti arahan secara lebih harfiah.

Kapan TIDAK menggunakan GPT-image-2

Jika Anda membutuhkan fine-tune anime tertentu, Lora khusus, atau kontrol lokal penuh, Stable Diffusion masih merupakan pilihan yang tepat. Jika Anda sudah berlangganan Midjourney dan menyukai gaya khasnya, tetaplah di sana. Kekuatan GPT-image-2 adalah keandalan — ia mengerjakan apa yang Anda deskripsikan.

Panduan biaya

Seorang kreator pada umumnya yang menghasilkan 100 gambar standar per bulan menghabiskan sekitar $5.30 dalam biaya OpenAI mentah. Pada layanan terkelola seperti gptimage2.plus, biayanya menjadi ~$10/bulan — selisihnya menutupi infrastruktur, dukungan, moderasi konten, dan (dalam kasus kami) riwayat generasi terhosting gratis.