Ilustrasi
Ilustrasi

Akselerasi Inferensi, F5 dan NVIDIA Dorong Efisiensi Ekonomi di Era AI Factory

Mohamad Mamduh • 05 Mei 2026 20:49
Ringkasnya gini..
  • Infrastruktur cerdas hasil kolaborasi ini memanfaatkan statistik NVIDIA NIM serta telemetri GPU.
  • Dengan mengalihkan fungsi jaringan dan enkripsi ke NVIDIA BlueField-3 DPU, kapasitas CPU host tetap terjaga untuk menjalankan fungsi utamanya.
  • Keunggulan ini dapat diterapkan langsung pada infrastruktur AI factory yang sudah ada tanpa perlu melakukan modifikasi pada model AI yang digunakan.
Jakarta: F5 memperluas kolaborasi strategis dengan NVIDIA untuk mengoptimalkan infrastruktur inferensi kecerdasan buatan atau AI. Integrasi terbaru ini menggabungkan F5 BIG-IP Next for Kubernetes dengan NVIDIA BlueField-3 DPU guna menciptakan lapisan infrastruktur cerdas yang mampu meningkatkan token throughput serta memangkas biaya operasional secara signifikan.
 
Dalam ekosistem AI modern, token merupakan unit output fundamental seperti kata atau fragmen data yang diproses selama tahap inferensi. Seiring transisi industri dari fase eksperimen menuju layanan komersial yang menghasilkan pendapatan, metrik keberhasilan kini bergeser dari sekadar kapasitas GPU menjadi apa yang disebut sebagai ekonomi token. Hal ini mencakup throughput berkelanjutan, time to first token atau TTFT, hingga pendapatan yang dihasilkan dari setiap akselerator GPU yang digunakan.
 
Infrastruktur cerdas hasil kolaborasi ini memanfaatkan statistik NVIDIA NIM serta telemetri GPU untuk melakukan pengambilan keputusan routing berbasis inferensi secara langsung atau real-time. Strategi tersebut memastikan setiap beban kerja diarahkan ke akselerator yang paling tepat sehingga mampu meningkatkan utilisasi GPU secara berkelanjutan sekaligus menurunkan latensi serta kebutuhan komputasi ulang.

Kunal Anand, Chief Product Officer F5 menjelaskan bahwa infrastruktur AI saat ini telah berevolusi menjadi upaya untuk memaksimalkan output ekonomi per akselerator. BIG-IP Next for Kubernetes menyediakan kecerdasan yang dibutuhkan untuk meningkatkan yield GPU serta mengurangi biaya per token agar organisasi dapat mengembangkan platform AI mereka dengan lebih percaya diri.
 
Pengujian independen yang dilakukan oleh The Tolly Group menunjukkan hasil yang sangat impresif. Solusi ini mampu memberikan peningkatan token throughput hingga empat puluh persen. Selain itu, waktu hingga token pertama muncul menjadi enam puluh satu persen lebih cepat dengan penurunan latensi permintaan secara keseluruhan sebesar tiga puluh empat persen.
 
Dengan mengalihkan fungsi jaringan dan enkripsi ke NVIDIA BlueField-3 DPU, kapasitas CPU host tetap terjaga untuk menjalankan fungsi utamanya yakni inferensi berkelanjutan dalam skala besar.
 
Keunggulan ini dapat diterapkan langsung pada infrastruktur AI factory yang sudah ada tanpa perlu melakukan modifikasi pada model AI yang digunakan. Melalui sinergi ini, F5 dan NVIDIA membantu organisasi mentransformasi infrastruktur mereka menjadi platform yang efisien, skalabel, dan siap menghadapi era agentic AI.
 
Cek Berita dan Artikel yang lain di
Google News
(MMI)




TERKAIT

BERITA LAINNYA