Apr 22, 2026 · 9 mnt baca
Bagaimana GPT-image-2 Sebenarnya Bekerja (Panduan Praktis untuk Kreator)
GPT-image-2 adalah model gambar terbaru dari OpenAI. Berikut panduan praktis untuk kreator — apa yang berubah dari DALL·E 3, apa yang baru di balik layar, dan cara memberikan prompt yang sebenarnya.
OpenAI merilis gpt-image-2 pada 21 April 2026, penerus seri DALL·E. Berbeda dengan DALL·E 3 yang terintegrasi erat dengan ChatGPT, gpt-image-2 hadir sebagai model API kelas satu pada minggu yang sama dengan rilis publiknya. Hal itu membawa konsekuensi — terhadap kualitas, terhadap apa yang dapat Anda kontrol, dan terhadap jenis pekerjaan yang cocok untuknya.
Apa yang baru dibandingkan DALL·E 3
- Resolusi native lebih tinggi: 1024² langsung dari awal, dengan 2K HD bawaan sesuai permintaan.
- Kesetiaan prompt yang lebih baik: prompt kompleks (multi-subjek, hubungan spasial) benar-benar berfungsi.
- Dukungan input gambar berkualitas tinggi — referensi yang diunggah tidak diturunkan resolusinya sebelum dibaca.
- Penetapan harga berbasis token: $8/M input gambar, $30/M output gambar — dapat diprediksi dan skalabel.
Tiga tingkatan kualitas, tiga titik harga
GPT-image-2 menyediakan setelan kualitas 'low', 'medium', dan 'high'. Masing-masing memetakan ke biaya per gambar yang berbeda: $0.006 / $0.053 / $0.211 pada 1024². Anda hampir selalu menginginkan medium untuk pekerjaan kasual — high adalah selisih antara 'gambar web yang tajam' dan 'sampul majalah'. Low cocok untuk ideasi: murah-dan-cepat, harap maklum dengan tepi yang kasar.
Pengeditan gambar benar-benar berfungsi
DALL·E 3 hanya untuk pembuatan. GPT-image-2 menerima gambar yang diunggah ditambah prompt dan mengembalikan suntingan yang koheren. Model menangani masking, pencahayaan, dan koherensi perspektif secara internal — Anda tidak memerlukan alur kerja ControlNet atau inpainting. Melukis mask masih membantu untuk suntingan yang presisi, tetapi sifatnya opsional.
Lima kebiasaan prompting yang membuahkan hasil
- Mulai dengan subjek. 'Seekor rubah astronaut di Mars.' Bukan 'Buatkan saya gambar di mana ada rubah…'
- Sebutkan kamera + pencahayaan berikutnya: '35mm, soft rim light, golden hour'.
- Akhiri dengan jangkar gaya: 'editorial photography', 'Studio Ghibli', 'flat illustration'.
- Hindari prompting negatif dalam bahasa Inggris biasa ('don't include…') — sebutkan apa yang Anda INGINKAN sebagai gantinya.
- Untuk HD, lebih spesifiklah. Model memiliki ruang lebih banyak dan mengikuti arahan secara lebih harfiah.
Kapan TIDAK menggunakan GPT-image-2
Jika Anda membutuhkan fine-tune anime tertentu, Lora khusus, atau kontrol lokal penuh, Stable Diffusion masih merupakan pilihan yang tepat. Jika Anda sudah berlangganan Midjourney dan menyukai gaya khasnya, tetaplah di sana. Kekuatan GPT-image-2 adalah keandalan — ia mengerjakan apa yang Anda deskripsikan.
Panduan biaya
Seorang kreator pada umumnya yang menghasilkan 100 gambar standar per bulan menghabiskan sekitar $5.30 dalam biaya OpenAI mentah. Pada layanan terkelola seperti gptimage2.plus, biayanya menjadi ~$10/bulan — selisihnya menutupi infrastruktur, dukungan, moderasi konten, dan (dalam kasus kami) riwayat generasi terhosting gratis.