Ilustrasi: NVIDIA
Ilustrasi: NVIDIA

NVIDIA Dominasi Benchmark MLPerf dengan Platform Blackwell Ultra

Mohamad Mamduh • 06 April 2026 12:06
Ringkasnya gini..
  • Dalam pengujian terbaru, GPU Blackwell Ultra mencatat performa terbaik di berbagai model dan skenario.
  • Hasilnya, sistem GB300 NVL72 dari NVIDIA mampu memberikan 2,7 kali throughput token lebih tinggi.
  • Ke depan, NVIDIA bersama MLCommons tengah mengembangkan MLPerf Endpoints.
Jakarta: NVIDIA mengumumkan pencapaian dalam benchmark MLPerf Inference v6.0. Melalui pendekatan extreme co-design yang mengintegrasikan perangkat keras, perangkat lunak, dan model AI, perusahaan ini mengklaim berhasil menghadirkan throughput tertinggi sekaligus menekan biaya token secara signifikan.
 
Dalam pengujian terbaru, GPU Blackwell Ultra mencatat performa terbaik di berbagai model dan skenario. NVIDIA kini telah mengumpulkan 291 kemenangan MLPerf sejak 2018, sembilan kali lebih banyak dibandingkan seluruh pesaing digabungkan.
 
Partisipasi mitra juga meningkat, dengan 14 perusahaan besar seperti Google Cloud, Dell, Cisco, Lenovo, dan Supermicro turut mengajukan hasil berbasis platform NVIDIA—menjadi jumlah partisipasi terbanyak sepanjang sejarah benchmark ini.

MLPerf kali ini juga memperkenalkan sejumlah benchmark baru, termasuk DeepSeek-R1 Interactive untuk interaktivitas lebih tinggi, Qwen3-VL-235B-A22B sebagai model multimodal visi-bahasa pertama, GPT-OSS-120B untuk reasoning LLM berbasis MoE, serta WAN-2.2-T2V-A14B yang menguji kemampuan generatif teks-ke-video. Ada pula DLRMv3, benchmark rekomendasi berbasis transformer.
 
Hasilnya, sistem GB300 NVL72 dari NVIDIA mampu memberikan 2,7 kali throughput token lebih tinggi dibandingkan enam bulan sebelumnya, sekaligus menurunkan biaya token lebih dari 60%.
 
Peningkatan ini didorong oleh optimasi perangkat lunak seperti TensorRT-LLM dan Dynamo, yang menghadirkan fitur-fitur baru seperti Wide Expert Parallel, Multi-Token Prediction, dan KV-aware routing.
 
Tak hanya itu, NVIDIA juga menunjukkan kemampuan scale-out dengan menghubungkan empat sistem GB300 NVL72 menggunakan Quantum-X800 InfiniBand, memproses jutaan token per detik. Ini menjadi submission terbesar dalam sejarah MLPerf, melibatkan 288 GPU Blackwell Ultra.
 
Ke depan, NVIDIA bersama MLCommons tengah mengembangkan MLPerf Endpoints, sebuah benchmark baru yang lebih mencerminkan performa dunia nyata dengan mengukur trafik API, bukan sekadar metrik chip-level.
 
Cek Berita dan Artikel yang lain di
Google News
(MMI)




TERKAIT

BERITA LAINNYA