Foto: NVIDIA
Foto: NVIDIA

Cloud Raksasa Gandeng NVIDIA Dynamo untuk Tingkatkan Performa AI

Mohamad Mamduh • 24 November 2025 11:06
Jakarta: Industri komputasi awan tengah memasuki babak baru dengan hadirnya NVIDIA Dynamo, sebuah platform perangkat lunak yang dirancang untuk meningkatkan performa inferensi kecerdasan buatan (AI) berskala besar.
 
Empat penyedia cloud terbesar dunia—Amazon Web Services (AWS), Google Cloud, Microsoft Azure, dan Oracle Cloud Infrastructure (OCI)—telah resmi mengintegrasikan Dynamo ke dalam layanan Kubernetes mereka. Langkah ini diyakini akan mempercepat adopsi AI generatif di level perusahaan.
 
NVIDIA menegaskan bahwa arsitektur Blackwell mampu memberikan 10 kali lipat performa dibanding generasi sebelumnya, Hopper. Dalam uji benchmark independen, sistem berbasis Blackwell Ultra GPU bahkan mencatat rekor throughput hingga 1,1 juta token per detik. Pencapaian ini membuka peluang besar bagi perusahaan untuk melayani jutaan pengguna secara bersamaan dengan biaya operasional yang lebih efisien.

Salah satu inovasi utama Dynamo adalah disaggregated serving, yaitu pemisahan proses prefill (pemrosesan input) dan decode (generasi output) ke GPU yang berbeda. Pendekatan ini mengurangi bottleneck dan meningkatkan efisiensi. Studi kasus dari perusahaan Baseten menunjukkan bahwa penggunaan Dynamo mampu melipatgandakan kecepatan inferensi untuk model kode dengan konteks panjang, tanpa perlu investasi perangkat keras tambahan.
 
Dengan integrasi ke dalam layanan Kubernetes terkelola, Dynamo memungkinkan perusahaan menjalankan inferensi multi-node secara lebih sederhana. Sistem ini mendukung GPU terbaru NVIDIA seperti GB200 dan GB300 NVL72, yang dirancang untuk kebutuhan AI berskala enterprise.
 
Selain itu, NVIDIA memperkenalkan Grove API sebagai bagian dari Dynamo. Grove memudahkan pengembang dalam mengatur komponen inferensi yang kompleks—mulai dari prefill, decode, hingga routing—dengan satu spesifikasi tingkat tinggi. Grove secara otomatis menangani skala, dependensi, dan penempatan node agar komunikasi antar GPU berlangsung cepat dan efisien.
 
Kehadiran Dynamo dan Grove diyakini akan menurunkan biaya produksi kecerdasan buatan sekaligus mempercepat waktu respons aplikasi. Tidak hanya raksasa cloud, mitra ekosistem seperti Nebius juga mulai mengadopsi teknologi ini untuk melayani beban kerja inferensi berskala besar.
 
Cek Berita dan Artikel yang lain di
Google News

Viral! 18 Kampus ternama memberikan beasiswa full sampai lulus untuk S1 dan S2 di Beasiswa OSC. Info lebih lengkap klik : osc.medcom.id
(MMI)




TERKAIT

BERITA LAINNYA

social
FOLLOW US

Ikuti media sosial medcom.id dan dapatkan berbagai keuntungan