Gemini 3 Flash diumumkan pada 17 Desember 2025 sebagai bagian dari lini Gemini 3, setelah sebelumnya Google meluncurkan Gemini 3 Pro dan Gemini 3 Deep Think.
Model ini dirancang untuk menghadirkan kemampuan penalaran tingkat lanjut dengan latensi rendah, sehingga dapat digunakan secara luas di berbagai produk Google.
Menurut Google, sejak peluncuran Gemini 3, sistem API mereka telah memproses lebih dari 1 triliun token per hari, dengan pemanfaatan yang mencakup simulasi pemrograman, pembuatan game interaktif, hingga pemahaman konten multimodal.
Gemini 3 Flash mempertahankan fondasi penalaran kelas Pro dari Gemini 3, namun dipadukan dengan karakteristik seri Flash yang menekankan kecepatan dan efisiensi. Model ini dirancang agar mampu menyelesaikan tugas harian dengan penalaran yang lebih baik, sekaligus mendukung agentic workflows yang membutuhkan respons cepat.
Google menyebut Gemini 3 Flash mampu memberikan performa frontier pada berbagai tolok ukur pengetahuan dan penalaran tingkat lanjut.
Model ini mencatat skor 90,4% pada GPQA Diamond serta 33,7% pada Humanity’s Last Exam tanpa bantuan alat tambahan. Pada pengujian multimodal MMMU Pro, Gemini 3 Flash meraih skor 81,2%, setara dengan Gemini 3 Pro.
Selain itu, Google menekankan efisiensi model ini. Pada tingkat penalaran tertinggi, Gemini 3 Flash mampu menyesuaikan durasi proses berpikir sesuai kompleksitas tugas, sekaligus menggunakan 30% token lebih sedikit dibandingkan Gemini 2.5 Pro dalam lalu lintas penggunaan umum.
Dari sisi performa, Gemini 3 Flash diklaim tiga kali lebih cepat dibandingkan Gemini 2.5 Pro, dengan biaya yang lebih rendah. Model ini ditawarkan dengan harga US$0,50 per 1 juta token input dan US$3 per 1 juta token output, sementara input audio tetap berada di US$1 per 1 juta token.
Pendekatan ini disebut Google sebagai upaya mendorong keseimbangan optimal antara kualitas, biaya, dan kecepatan, sekaligus memperluas akses ke model AI berperforma tinggi.
Gemini 3 Flash ditujukan untuk pengembangan iteratif dengan latensi rendah, termasuk untuk sistem produksi dan aplikasi interaktif. Dalam pengujian SWE-bench Verified, tolok ukur untuk kemampuan agen pemrograman, Gemini 3 Flash mencatat skor 78%, melampaui seri 2.5 dan bahkan Gemini 3 Pro.
Model ini juga mendukung penggunaan lanjutan seperti analisis video kompleks, ekstraksi data, dan visual question answering, sehingga dapat dimanfaatkan untuk membangun aplikasi yang membutuhkan penalaran mendalam sekaligus respons cepat.
Sejumlah perusahaan seperti JetBrains, Bridgewater Associates, dan Figma disebut telah menggunakan Gemini 3 Flash untuk mendukung operasional mereka. Model ini kini tersedia bagi perusahaan melalui Vertex AI dan Gemini Enterprise.
Untuk pengguna umum, Gemini 3 Flash mulai digulirkan secara global sebagai model default di aplikasi Gemini, menggantikan Gemini 2.5 Flash. Dengan perubahan ini, seluruh pengguna Gemini dapat mengakses pengalaman Gemini 3 tanpa biaya tambahan.
Model ini juga mulai diterapkan sebagai model standar untuk AI Mode di Search, yang dirancang agar mampu memahami pertanyaan kompleks dengan lebih mendalam, menyajikan jawaban terstruktur, serta memadukan informasi real-time dari web.
Google menyatakan Gemini 3 Flash kini tersedia dalam tahap pratinjau melalui Gemini API di Google AI Studio, Google Antigravity, Vertex AI, Gemini Enterprise, serta berbagai alat pengembang lainnya. Model ini juga mulai hadir di aplikasi Gemini dan AI Mode di Search, membawa akses cepat ke kecerdasan buatan generasi terbaru.
Cek Berita dan Artikel yang lain di
Google News