Salah satu sorotan utama adalah dukungan AWS terhadap NVIDIA NVLink Fusion, sebuah platform interkoneksi yang memungkinkan pembangunan infrastruktur AI kustom berskala besar.
Teknologi ini akan diintegrasikan ke dalam chip Trainium4 generasi berikutnya, CPU Graviton, serta AWS Nitro System, sehingga memungkinkan peningkatan performa signifikan untuk beban kerja AI, termasuk pelatihan model besar dan inferensi berkecepatan tinggi.
AWS juga telah mengadopsi arsitektur NVIDIA MGX dalam skala besar, dan integrasi NVLink Fusion akan semakin menyederhanakan proses deployment serta manajemen sistem. Ekosistem pemasok NVLink Fusion menyediakan komponen lengkap mulai dari rack, chassis, hingga sistem pendingin, sehingga mempercepat waktu implementasi bagi pelanggan yang membutuhkan infrastruktur AI tingkat lanjut.
Di sisi perangkat keras, AWS memperluas portofolio komputasi akselerasinya dengan menghadirkan GPU berbasis arsitektur NVIDIA Blackwell, termasuk HGX B300, GB300 NVL72, dan RTX PRO 6000 Blackwell Server Edition.
GPU ini akan menjadi tulang punggung AWS AI Factories, layanan baru yang memungkinkan organisasi memiliki infrastruktur AI khusus di pusat data mereka sendiri sambil tetap memenuhi regulasi lokal dan kebutuhan sovereign AI.
Kolaborasi ini juga mencakup integrasi model open-source NVIDIA Nemotron ke dalam Amazon Bedrock. Model seperti Nemotron Nano 2 dan Nano 2 VL kini dapat digunakan untuk membangun aplikasi generatif dan agen AI dengan efisiensi tinggi. Perusahaan seperti CrowdStrike dan BridgeWise menjadi pengguna awal layanan ini.
Pada lapisan software, NVIDIA dan AWS menghadirkan akselerasi GPU serverless untuk Amazon OpenSearch Service melalui pustaka NVIDIA cuVS, yang mampu mempercepat pembuatan indeks vektor hingga 10 kali lipat dengan biaya seperempat dari sebelumnya. Integrasi ini membuka peluang baru untuk aplikasi RAG, pencarian vektor, dan pemrosesan data tidak terstruktur dalam skala besar.
Tak hanya itu, NVIDIA juga membawa model dunia Cosmos ke AWS melalui layanan EKS dan AWS Batch, memungkinkan simulasi robotika, kontrol real-time, dan generasi data sintetis untuk pengembangan physical AI. Sejumlah perusahaan robotika global telah memanfaatkan platform ini untuk mempercepat inovasi mereka.
Cek Berita dan Artikel yang lain di
Google News