Dalam pengujian terbaru, GPU Blackwell Ultra mencatat performa terbaik di berbagai model dan skenario. NVIDIA kini telah mengumpulkan 291 kemenangan MLPerf sejak 2018, sembilan kali lebih banyak dibandingkan seluruh pesaing digabungkan.
Partisipasi mitra juga meningkat, dengan 14 perusahaan besar seperti Google Cloud, Dell, Cisco, Lenovo, dan Supermicro turut mengajukan hasil berbasis platform NVIDIA—menjadi jumlah partisipasi terbanyak sepanjang sejarah benchmark ini.
MLPerf kali ini juga memperkenalkan sejumlah benchmark baru, termasuk DeepSeek-R1 Interactive untuk interaktivitas lebih tinggi, Qwen3-VL-235B-A22B sebagai model multimodal visi-bahasa pertama, GPT-OSS-120B untuk reasoning LLM berbasis MoE, serta WAN-2.2-T2V-A14B yang menguji kemampuan generatif teks-ke-video. Ada pula DLRMv3, benchmark rekomendasi berbasis transformer.
Hasilnya, sistem GB300 NVL72 dari NVIDIA mampu memberikan 2,7 kali throughput token lebih tinggi dibandingkan enam bulan sebelumnya, sekaligus menurunkan biaya token lebih dari 60%.
Peningkatan ini didorong oleh optimasi perangkat lunak seperti TensorRT-LLM dan Dynamo, yang menghadirkan fitur-fitur baru seperti Wide Expert Parallel, Multi-Token Prediction, dan KV-aware routing.
Tak hanya itu, NVIDIA juga menunjukkan kemampuan scale-out dengan menghubungkan empat sistem GB300 NVL72 menggunakan Quantum-X800 InfiniBand, memproses jutaan token per detik. Ini menjadi submission terbesar dalam sejarah MLPerf, melibatkan 288 GPU Blackwell Ultra.
Ke depan, NVIDIA bersama MLCommons tengah mengembangkan MLPerf Endpoints, sebuah benchmark baru yang lebih mencerminkan performa dunia nyata dengan mengukur trafik API, bukan sekadar metrik chip-level.
Cek Berita dan Artikel yang lain di
Google News